Spelling suggestions: "subject:"sprechtempo"" "subject:"sprechtempos""
1 |
Entwurf und Evaluation eines Prosodieverständnistests in deutscher Pseudosprache / Design and evaluation of a prosody recognition test in german pseudo-languageHirschfeld, Josefine January 2011 (has links) (PDF)
In der CI-Forschung ist bislang wenig untersucht worden, ob CI-Träger in der Lage sind, mit Hilfe ihrer Implantate Melodie- und Betonungsverläufe in der menschlichen Sprache zu erkennen. Da Cochlea-Implantate ursprünglich mit dem Fokus auf das phonologische Sprachverstehen entwickelt wurden, in den letzten Jahren jedoch technologische Verbesserungen kontinuierlich eingeführt wurden, ist diese Fragestellung besonders interessant. Solche Merkmale der Sprache, die sich in Form von Grundfrequenz- und Lautheitsschwankungen, sowie Sprechtempo- und Rhythmus darstellen, werden als Prosodie bezeichnet. Die menschliche Sprache ist affektiv geprägt und bei intensiven Gemütsregungen sind diese Melodieverläufe bzw. die prosodischen Merkmale besonders deutlich. Daher bietet es sich an, mit emotionaler Sprache zu arbeiten, sie dient als Lieferant für Grundfrequenz- und Intensitätsschwankungen. Im Rahmen psychologischer und linguistischer Untersuchungen sind solcherlei Versuche bereits an normalhörenden Personen durchgeführt worden, allerdings stets auf der Grundlage semantisch-sinntragender Sprache, deren Inhalt bei der Bewertung des Gehörten nicht ohne Einfluss bleibt. Daher wurde in der vorliegenden Arbeit eine künstliche Sprache automatisiert erzeugt, die in der statistischen Struktur ihrer Buchstabenzusammensetzung und Lautfolge der deutschen Sprache ähnelt. Diese Pseudosprache wurde in Form von 44 Sätzen in zehn verschiedenen Emotionen aufgenommen und durch nachträgliche Schneide- und Auswahlarbeiten als abhörbare Audiodateien fertiggestellt. Dabei lagen sie je zur Hälfte als 10- und 15-silbige Sätze vor. Es kamen professionelle digitale Aufnahmegeräte zum Einsatz, deren Aufstellung in Vorversuchen systematisch optimiert wurde. Die Evaluierung der Sätze und die anschließende Auswertung der Ergebnisse geschahen im Rahmen einer Untersuchung mit Probanden ohne Höreinschränkungen, um diesen neuartigen Test zunächst auf seine prinzipielle Anwendbarkeit hin zu prüfen. Die zugrundeliegende Fragestellung war, ob bei normalhörenden Personen ein korrektes Erkennen von Emotionen in der gesprochenen Sprache nachweisbar ist. Durch die Ergebnisse sollten Hinweise auf die Einsatzmöglichkeiten des Tests bei CI-Trägern gewonnen werden. Der Test wurde erst nach Ablauf einer vorgeschalteten Pilotstudie konstruiert. Dadurch konnten Verbesserungsmöglichkeiten im Design und in der Durchführung des Tests vorab erkannt und umgesetzt werden. Die Sätze wurden den Probanden der Hauptgruppe in einem genau festgelegten Schema vorgespielt, der Test war untergliedert in einen offen und einen geschlossen zu beurteilenden Abschnitt. Die Ergebnisse zeigen, dass die Fähigkeit der Probanden zur Erkennung der Emotionen nachweislich vorhanden ist, ohne Unterschied zwischen männlichen und weiblichen Probanden. Dabei wurden sowohl im offenen als auch im geschlossenen Test bestimmte Emotionen (z.B. Gleichgültigkeit, Panik, Trauer) grundsätzlich besser erkannt als andere (z.B. Ekel, Freude, Stolz). Zwei der Emotionen (Ärger, Zorn) erwiesen sich als kaum unterscheidbar, weswegen eine davon herausgenommen werden sollte und somit neun verwendbare Emotionen resultieren. Die Aufsprachen und die Evaluierung der prosodischen Sätze in dieser Arbeit sind Grundsteine für die Erörterung und Durchführung sinnvoller Veränderungen an diesem Prosodieverständnistest, bevor er bei CI-Trägern zur Anwendung kommt. Solche Veränderungen könnten in technischen Verbesserungen bestehen, in der Variation der prosodischen Darstellungsmöglichkeiten von Emotionen, in der Aufsprache durch professionelle Schauspieler oder in der Erweiterung um eine weibliche Sprecherstimme. Das Ziel zukünftiger Arbeiten zu diesem Thema ist es, den vorliegenden Test so weiterzuentwickeln, dass er in der Lage ist, in der CI-Forschung zur Gewinnung neuer Erkenntnisse beizutragen. Im Hinblick auf den weiteren praktischen Einsatz konnten bereits in dieser Arbeit die wichtigsten Voraussetzungen und Anforderungen erfüllt und das Konzept eines klinisch anwendbaren Emotions-Prosodietests erfolgreich umgesetzt werden. / In cochlear implant research it has been only marginally investigated, whether CI-users are able to recognize melody contour and accentuation in human speech with their implants. Since cochlear implants have been developed with the focus on phonological speech understanding, yet technological improvements have been continuously introduced, this question is especially interesting. Such properties of speech, that manifest in fundamental frequency and loudness fluctuations as well as speech tempo and rhythm are referred to as prosody. Human speech is affective and at intense emotions these prosodic characteristics are notably distinct. Therefore, working with emotional speech appears suitable, since it serves as a source of fundamental frequency and intensity fluctuations. In the context of psychological and linguistic studies, such tests have already been performed with normal hearing subjects. However, the speech material used was always semantically meaningful, which likely affects the subjects' judgment. Hence, in this thesis artificial, computer-generated language was employed, which replicates German regarding the occurrence probability of letters and letter sequences. 44 pseudo-German sentences, repeatedly spoken in 10 different emotions each, were recorded, cut, selected and prepared as audio files. Half of the sentences consisted of 10, the other half of 15 syllables per sentence. The recording was performed with professional digital recording equipment, where the set-up had been optimized systematically in preceding tests. Evaluation of the sentences and subsequent analysis of results were conducted as a study with normal hearing subjects in order to test the new speech material for its applicability in principle. The underlying question was whether it could be demonstrated that normal hearing subjects were able to correctly recognize the 10 different emotions in speech. Also, indicators regarding the suitability for CI-users were hoped for. The main experiment was designed only after a preceding pilot study. Thus, improvements in the study design and implementation could be identified in advance. The sentences were offered to the main group in a precisely defined scheme. The test was divided into an open and a closed part. Results show statistically significant capabilities of emotion recognition in the test subjects. There was no difference between male and female subjects. In both the open as well as in the closed section, specific emotions (e.g. boredom, panic, grief) were recognized significantly better than others (e.g. disgust, joy, pride). Two of the emotions (anger, rage) could be barely distinguished. Thus, one of the two should be eliminated, leaving nine usable emotions. The recordings and the evaluation of the prosodic sentences are building blocks for the discussion and implementation of necessary changes of this prosody recognition test prior to its application to CI users. Such modifications could consist of technological improvements, variations of the prosodic presentation of emotions or the assignment of professional actors or an additional female speaker. The aim of future work on this topic is to further develop this test in such a way, that it contributes to new insights in CI research. With respect to further practical use, within this thesis some of the most important prerequisites and requirements could be fulfilled and the concept of a clinically applicable prosody test was implemented.
|
2 |
Sprechtempo im SprachvergleichGebhard, Christian 10 August 2012 (has links)
In dieser Arbeit werden verschiedene Sprechtempoparameter in den Sprachen Chinesisch, Deutsch, Englisch, brasilianisches und europäisches Portugiesisch sowie Spanisch zueinander in Bezug gesetzt: Die Maßeinheiten Laute, Silben, Wörter und Morpheme pro Sekunde werden unter Ein- und Ausschluss der Pausenzeit gemessen. Dabei ergeben sich für die germanischen Sprachen niedrige Durchschnittswerte, die romanischen Sprachen liegen im mittleren bis hohen Bereich und das Chinesische weist je nach betrachtetem Parameter mittlere oder hohe Werte auf. Eine Analyse der Pausenstruktur ergibt vergleichbare Pausenanteile, aber einen höheren Anteil interner Pausen in den Sprachen Chinesisch, europäisches Portugiesisch und Spanisch. Weiterhin werden nonverbale Aspekte berücksichtigt und die Größen Gesten, Gesichts¬ausdrücke und Bewegungen des Kopfes und Oberkörpers pro Minute gemessen. Im brasilianischen Portugiesisch sind Gesten und im Chinesischen Bewegungen des Kopfes und Oberkörpers auffallend häufig. Geschlechtsspezifische Unterschiede sind in allen Bereichen gering und nur im europäischen Portugiesisch statistisch signifikant. Bezüglich des wahrgenommenen Sprechtempos zeigt sich in Experimenten und Umfragen, dass die romanischen Sprachen als schnell bezeichnet werden. Chinesische Hörer schätzen außerdem das Sprechtempo anders ein als deutsche, wobei die Silbenkomplexität für beide Gruppen unterschiedliche Rollen spielt. Daneben bestehen zwischen diesen beiden Gruppen signifikante Unterschiede in der Beurteilung von Sachlichkeit und Vertrauenswürdigkeit in Aufnahmen. Für die untersuchte Sprechsituation wird davon ausgegangen, dass in verschiedenen Sprachgemeinschaften die Verwendung unterschiedlicher sprachlicher (verbaler wie nonverbaler) Mittel bevorzugt wird. Das Sprechtempo wird damit als eine von phonetisch-phonologischen Faktoren, aber auch von in gesellschaftlichen Gruppen vorhandenen Tendenzen im Sprachgebrauch beeinflusste Größe verstanden. / This doctoral thesis is a cross-linguistic analysis of speech tempo, comparing Chinese, English, German, Brazilian and European Portuguese, and Spanish. There are several parameters of speech tempo under analysis: sounds, syllables, words, and morphemes per second. The Germanic languages show lower values, whereas Romance languages tend to have medium and high values, and Chinese appears to have different, both medium and high values depending on what element is counted. An analysis of pause structure renders comparable percentages of time spent on silence, yet the proportion of internal pauses is considerably higher in Chinese, European Portuguese and Spanish. Furthermore, nonverbal aspects of speech are considered and data are collected for the measures gestures, facial expressions and movements of the head and torso per minute. Gestures are remarkably more frequent in Brazilian Portuguese, and movements of the head/torso are highly frequent in Chinese. Differences between genders are generally small, only within European Portuguese some statistically significant differences can be observed. Surveys on stereotypes and perception experiments show that the Romance languages are generally perceived as spoken more rapidly. The listeners’ native language appears to be a factor of perceived speech tempo: Chinese listeners’ responses are significantly different from German listeners’ responses. Syllable complexity plays different roles for these two groups of listeners. They also show significant differences when judging objectivity and trustworthyness in recordings. Considering the particular communication situation analyzed here, it is pointed out that in different speech communities, different verbal and nonverbal behavior is preferred in certain contexts. Speech tempo is influenced by phonetic and phonological factors, as well as tendencies towards a certain communicative style that can be observed within a given society.
|
Page generated in 0.0318 seconds