Return to search

Situated, perceptual, emotive and cognitive music systems: a psychologically grounded approach to interactive music composition

This thesis introduces a novel situated interactive composition system called the SMuSe
(for Situated Music Server) that is grounded on principles of modern cognitive science,
provides perceptual control of sound synthesis and includes emotional feedback. It
illustrates both a new music composition paradigm and a synthetic psychology
approach to the study of music perception, emotion and cognition. The SMuSe is
composed of cognitively plausible modules implemented as a hierarchy of musical
agents and relies on distributed control, parallelism, emergence and embodiment. By
interacting with its environment, which provides feedback via multiple sensors, the
system generates complex adaptive affective musical structures. Focusing on the
micro-level of sound generation, we present two complementary techniques that give
high-level perceptual control over low-level sound synthesis parameters. In a first
implicit approach, a support vector machine algorithm learns to automatically map
perceptual features such as loudness, pitch and brightness onto additive synthesis
parameters. In a second approach, a physically-inspired synthesis model provides
explicit access to perceptual and physical parameters such as pitch, loudness,
brightness, attack time, inharmonicity and damping. Moving from the study of music
generation and control towards the study of the musical experience itself, we then
evaluate how the music generated by the SMuSe influences the listeners' emotional
responses. A first psychoacoustics experiment shows the significant influence of
structural (scale, register, harmony), expressive (velocity, tempo, articulation) and
timbre (brightness, attack time, spectral flux) parameters on the emotional scales of
valence, arousal and dominance. An additional large scale experiment involving
dementia patients (an illness known to induce cognitive and affective deficits) shows
that specific sound features (e.g. low loudness, low brightness) provoke specific
emotional responses within the patients (e.g. low stress). Moreover, the patients'
emotional responses differ from the age-matched control group, and the analysis
shows an increased emotional sensitivity to sounds as the severity of the disease
increases. These results suggest that sound-based therapy and diagnosis for dementia
are possible. Finally, the maturity and flexibility of the SMuSe music system are
demonstrated by a series of real-world applications including the sonification of a
mixed-reality space, a study on physiologically-based musical interaction, a
neurofeedback musical interface, a closed loop system based on reinforcement
learning of emotional feedback, and a large scale multimedia performance using
brain-computer interfaces. A situated, perceptive, emotive and cognitive approach to
the design of musical systems paves the way for new applications for therapy but also
for interactive gaming and novel physiologically-based instruments. Our approach
provides a well-grounded paradigm to develop advanced synthetic aesthetics system
that can inform our understanding of the psychological processes on which they rely. / Esta tesis introduce un nuevo sistema de composición situada e interactiva
llamado SMuSe (por Situated Music Server). Dicho sistema está basado en
principios extraídos de la ciencia cognitiva moderna, proporciona control
perceptual sobre la síntesis sonora e incluye feedback emocional. Por lo tanto,
ilustra tanto un paradigma nuevo para la composición musical, como un
sintético enfoque psicológico al estudio de la percepción musical, las
emociones y la cognición. SMuSe consta de diversos modulos, plausibles desde
un punto de vista cognitivo, implementados como una jerarquía de agentes. El
funcionamiento de SMuSe explota los principios de control distribuido,
paralelismo, emergencia y embodiment. En función del feedback obtenido por
la interacción con el entorno, el sistema genera complejas estructuras
musicales afectivas. En concreto, a nivel de generación de sonido, presentamos
dos técnicas complementarias que proporcionan un control perceptivo de alto
nivel sobre parámetros concretos de síntesis sonora. En un primer método
implícito, un algoritmo de support vector machine aprende a traducir
automáticamente características perceptuales, como volumen, tono y brillo en
parámetros de síntesis aditiva. En el segundo método, un modelo físico de
síntesis proporciona explícitamente acceso a parámetros perceptivos y físicos,
tales como tono, volumen, brillo, tiempo de ataque, inarmonía y factor de
amortiguamiento. En lo que respecta al estudio de la experiencia musical en sí
misma, evaluamos la influencia de la música generada por SMuSe en las
respuestas emocionales del sujeto. Un primer experimento psicoacústico
muestra la influencia significativa que tienen parámetros estructurales
(escala,registro, armonía), expresivos (velocidad, tempo, articulación) y de
timbre (brillo, ataque, flujo espectral) en la escalas emocionales de valencia,
activacíon y dominancia. Adicionalmente, un experimento de gran escala
realizado con pacientes de demencia, una patología que asociada a déficits
afectivos y cognitivos, demuestra que los pacientes responden
emocionalmente a rasgos específicos del sonido (e.g. bajo volumen y brillo
inducen poca tensión). Además, la respuesta emocional de los pacientes difiere
si se compara con la mostrada por un grupo de control con la misma edad
media. De tal manera, una mayor respuesta emocional aparece asociada a un
mayor grado de demencia. Estos resultados sugieren que sería posible
desarrollar técnicas basadas en el uso de música tanto para el tratamiento de
la demencia como para su diagnóstico. Para concluir, la madurez y flexibilidad
de SMuSe se demuestra con una serie de aplicaciones que incluyen la
sonificación de un espacio de realidad mixta, un estudio acerca de la
interacción musical mediante datos fisiológicos, un interfaz musical basado en
feedback neurológico, un sistema basado en aprendizaje por refuerzo del
feedback emocional, y una performance multimedia de gran escala controlada
mediante interfaces cerebro-máquina. Este enfoque situado, perceptivo,
emocional y cognitivo al diseño de sistemas musicales abre la posibilidad de
desarrollar aplicaciones no sólo terapéuticas sino también para los juegos
interactivos y nuevos interfaces que empleen fisiología. Nuestra propuesta
proporciona un sólido paradigma para el desarrollo de sistemas de síntesis de
estéticas avanzadas, que puedan servir para entender los procesos
psicológicos subyacentes

Identiferoai:union.ndltd.org:TDX_UPF/oai:www.tdx.cat:10803/32043
Date19 May 2011
CreatorsLe Groux, Sylvain
ContributorsVerschure, Paul F. M. J., Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
PublisherUniversitat Pompeu Fabra
Source SetsUniversitat Pompeu Fabra
LanguageEnglish
Detected LanguageSpanish
Typeinfo:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion
Format246 p., application/pdf
SourceTDX (Tesis Doctorals en Xarxa)
Rightsinfo:eu-repo/semantics/openAccess, ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Page generated in 0.0025 seconds