Bien que de plus en plus de données sonores et audiovisuelles soient disponibles, la majorité des interfaces qui permettent d'y accéder reposent uniquement sur une présentation visuelle. De nombreuses techniques de visualisation ont déjà été proposées utilisant une présentation simultanée de plusieurs documents et des distorsions permettant de mettre en relief l'information plus pertinente. Nous proposons de définir des équivalents auditifs pour la présentation de plusieurs fichiers sonores en concurrence, et de combiner de façon optimale les stratégies audio et visuelles pour la présentation de documents multimédia. Afin d'adapter au mieux ces stratégies à l'utilisateur, nous avons dirigé nos recherches sur l'étude des processus perceptifs et attentionnels impliqués dans l'écoute et l'observation d'objets audiovisuels concurrents, en insistant sur les interactions entre les deux modalités.Exploitant les paramètres de taille visuelle et de volume sonore, nous avons étendu le concept de lentille grossissante, utilisée dans les méthodes focus+contexte visuelles, aux modalités auditive et audiovisuelle. A partir de ce concept, une application de navigation dans une collection de documents vidéo a été développée. Nous avons comparé notre outil à un autre mode de rendu dit de Pan&Zoom à travers une étude d'utilisabilité. Les résultats, en particulier subjectifs, encouragent à poursuivre vers des stratégies de présentation multimodales associant un rendu audio aux rendus visuels déjà disponibles.Une seconde étude a concerné l'identification de sons d'environnement en milieu bruité en présence d'un contexte visuel. Le bruit simule la présence de plusieurs sources sonores simultanées telles qu'on pourrait les retrouver dans une interface où les documents audio et audiovisuels sont présentés ensemble. Les résultats de cette expérience ont confirmé l'avantage de la multimodalité en condition de dégradation. De plus, au-delà des buts premiers de la thèse, l'étude a confirmé l'importance de la congruence sémantique entre les composantes visuelle et sonore pour la reconnaissance d'objets et a permis d'approfondir les connaissances sur la perception auditive des sons d'environnement.Finalement, nous nous sommes intéressée aux processus attentionnels impliqués dans la recherche d'un objet parmi plusieurs, en particulier au phénomène de " pop-out " par lequel un objet saillant attire l'attention automatiquement. En visuel, un objet net attire l'attention au milieu d'objets flous et certaines stratégies de présentation visuelle exploitent déjà ce paramètre visuel. Nous avons alors étendu la notion de flou aux modalités auditives et audiovisuelles par analogie. Une série d'expériences perceptives a confirmé qu'un objet net parmi des objets flous attire l'attention, quelle que soit la modalité. Les processus de recherche et d'identification sont alors accélérés quand l'indice de netteté correspond à la cible, mais ralentis quand il s'agit d'un distracteur, mettant ainsi en avant un phénomène de guidage involontaire. Concernant l'interaction intermodale, la combinaison redondante des flous audio et visuel s'est révélée encore plus efficace qu'une présentation unimodale. Les résultats indiquent aussi qu'une combinaison optimale n'implique pas d'appliquer obligatoirement une distorsion sur les deux modalités.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00770309 |
Date | 29 October 2012 |
Creators | Bouchara, Tifanie |
Publisher | Université Paris Sud - Paris XI |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0021 seconds