• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • 1
  • Tagged with
  • 3
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Indexation audio-visuelle des personnes dans un contexte de télévision

Bendris, Meriem 07 July 2011 (has links) (PDF)
Le développement et l'amélioration du réseau Internet a permis de mettre un grand nombre de contenus télévisuels à disposition des utilisateurs. Afin de faciliter la navigation parmi ces vidéos, il est intéressant de développer des technologies pour indexer les personnes automatiquement. Les solutions actuelles proposent de construire l'index audio-visuel des personnes par combinaison des index audio et visuel obtenus de manière indépendante. Malheureusement, pour les émissions de télévision, il est difficile de détecter et de regrouper les personnes automatiquement à cause des nombreuses ambiguïtés dans l'audio, le visuel et leur association (interactivité des dialogues, variations de pose du visage, asynchronie entre la parole et l'apparence, etc). Les approches basées sur la fusion des index audio et visuel combinent les erreurs d'indexation issues de chaque modalité. Les travaux présentés dans ce rapport exploitent la complémentarité entre les informations audio et visuelle afin de palier aux faiblesses de chaque modalité. Ainsi, une modalité peut appuyer l'indexation d'une personne lorsque l'autre est jugée peu fiable. Nous proposons une procédure de correction mutuelle des erreurs d'indexation de chaque modalité. D'abord, les erreurs sont détectées automatiquement à l'aide d'indicateurs de présence de visage parlant. Puis, la modalité qui a échoué est corrigée grâce à un schéma automatique. Nous avons proposé en premier lieu un système initial d'indexation de visages parlants basé sur la détection et le regroupement du locuteur et du costume. Nous proposons une méthode de combinaison d'index basée sur la maximisation de la couverture globale des groupes de personnes. Ce système, évalué sur des émissions de plateaux, obtient une grande précision (90%), mais un faible rappel (seulement 55% des visages parlants sont détectés). Afin de détecter automatiquement la présence d'un visage parlant dans le processus de correction mutuelle, nous avons développé une nouvelle méthode de détection de mouvement des lèvres basée sur la mesure du degré de désordre de la direction des pixels autour de la région des lèvres. L'évaluation, réalisée sur le corpus de d'émission de plateaux, montre une amélioration significative de la détection des visages parlants comparé à l'état de l'art dans ce contexte. En particulier, notre méthode s'avère être plus robuste à un mouvement global du visage. Enfin, nous avons proposé deux schémas de correction. Le premier est basé sur une modification systématique de la modalité considérée a priori la moins fiable. Le second compare des scores de vérification de l'identité non supervisée afin de déterminer quelle modalité a échoué et la corriger. Les modèles non supervisés des personnes sont appris à partir des ensembles homogènes de visages parlants obtenus automatiquement par le système initial. Les deux méthodes de correction conduisent à une amélioration significative des performances (+2 à 5% de la F-mesure). Nous nous sommes également intéressé aux systèmes biométriques audio-visuels et particulièrement sur les techniques de fusion tardives pour la vérification d'identité. Nous avons proposé une méthode de fusion dépendante de la qualité du signal dans chaque modalité.
2

A corpus-based study of the phraseological behaviour of abstract nouns in medical English. A Needs Analysis of a Spanish medical community

Laso Martín, Natàlia Judith 23 January 2009 (has links)
It has been long acknowledged (Carter 1998, Williams 1998; Biber 2006; Hyland 2008) that writing a text not only entails the accurate selection of correct terms and grammatical constructions but also a good command of appropriate lexical combinations and phraseological expressions. This assumption becomes especially apparent in scientific discourse, where a precise expression of ideas and description of results is expected. Several scholars (Gledhill 2000; Flowerdew 2003; Hyland 2008) have pointed to the importance of mastering the prototypical formulaic patterns of scientific discourse so as to produce phraseologically competent scientific texts.Research on specific-domain phraseology has demonstrated that acquiring the appropriate phraseological knowledge (i.e. mastering the prototypical lexicogrammatical patterns in which multiword units occur) is particularly difficult for non-native speakers, who must gain control of the conventions of native-like discourse (Howarth 1996/1998; Wray 1999; Oakey 2002; Williams 2005; Granger & Meunier 2008).The present dissertation aims to analyse native and non-native speakers' usage of five abstract nouns, i.e. agreement, comparison, conclusion, contribution and decision, in medical English. In order to explore non-native speakers' lexical and phraseological command of the five selected nouns, a Worksheet of four exercises was distributed among a community of twenty-four Spanish doctors, who were practising medicine in three different Spanish hospitals; namely, Complejo Hospitalario Universitario de Albacete, Hospital Universitario Puerta de Hierro and Hospital de Navarra.With the aim of assessing non-native speakers' phraseological competence regarding the use of abstract nouns, their written production will be compared against a native corpus. Thus, it can be claimed that this investigation also attempts to contribute to the linguistic characterisation of the discourse of medical science. More precisely, this thesis project intends to explore native speakers' prototypical lexico-grammatical patterns around the five abstract nouns under investigation. This analysis is based entirely on corpus evidence, since all collocational patterns discussed have been extracted from the Health Science Corpus (HSC), compiled by the Grup de Recerca en Lexicologia i Lingüística de Corpus (GReLiC), University of Barcelona. The HSC consists of a 4 million word collection of health science (i.e. medicine, biomedicine, biology and biochemistry) texts, specifically compiled for the current research study.The exploration of the collocational behaviour of abstract nouns in medical English will serve as a benchmark against which to measure non-native speakers' production. / Diversos estudios (Carter 1998, Williams 1998; Biber 2006; Hyland 2008) han constatado que la producción de un texto no sólo implica una adecuada selección de términos léxicos y estructuras gramaticales, sino también un buen dominio de combinaciones léxicas y expresiones fraseológicas. Este hecho se hace particularmente evidente en el discurso científico, en el que se espera que tanto la expresión de ideas como la descripción de resultados sea lo más precisa posible.Numerosos especialistas (Gledhill 2000; Flowerdew 2003; Hyland 2008) han señalado la importancia de dominar las estructuras formulaicas propias del discurso científico para producir textos fraseológicamente aceptables.El estudio de la fraseología característica de registros específicos ha demostrado que la correcta utilización de estructuras fraseológicas; es decir, el dominio de los patrones léxico-gramaticales en los que aparecen las estructuras prefabricadas propias del lenguaje científico supone una gran dificultad para los hablantes no nativos, quienes deben familiarizarse con las convenciones del discurso producido por nativos (Howarth 1996/1998; Wray 1999; Oakey 2002; Williams 2005; Granger & Meunier 2008).La presente tesis doctoral pretende analizar el uso que tanto hablantes nativos como no nativos hacen de cinco nombres abstractos (agreement, comparison, conclusion, contribution y decisión) en su producción de textos médicos. Con el objetivo de examinar el dominio léxico y fraseológico que los hablantes no nativos muestran de los mencionados nombres abstractos, cuatro fichas de ejercicios se repartieron entre una comunidad de 24 doctores que ejercen la medicina en alguno de los siguientes centros hospitalarios: Complejo Hospitalario Universitario de Albacete, Hospital Universitario Puerta de Hierro y Hospital de Navarra.Con la intención de investigar la competencia fraseológica de los médicos españoles participantes en el estudio por lo que respecta al uso de nombres abstractos, su producción escrita se ha comparado con un corpus nativo, el "Health Science Corpus "(HSC), compilado por el "Grup de Recerca en Lexicologia i Lingüística de Corpus" (GReLiC) de la Universidad de Barcelona. Por lo tanto, la presente investigación pretende, por un lado, contribuir a la caracterización lingüística del discurso propio del inglés médico. Más concretamente, este trabajo analiza la producción escrita de científicos nativos en relación a los patrones léxico-gramaticales más frecuentemente utilizados con los cinco nombres abstractos sometidos a estudio. Todos los patrones colocacionales tratados en el presente trabajo han sido extraídos del HSC, el cual consiste en una colección de textos, de aproximadamente 4 millones de palabras, procedentes de revistas científicas de las áreas de la medicina, la biomedicina, la biología y la bioquímica. Por otro lado, el análisis del HSC con respecto al comportamiento colocacional de los nombres abstractos en inglés médico servirá también de corpus de referencia para comparar el uso que de ellos hacen los médicos no nativos.
3

Síntesis Audiovisual Realista Personalizable

Melenchón Maldonado, Javier 13 July 2007 (has links)
Es presenta un esquema únic per a la síntesi i anàlisi audiovisual personalitzable realista de seqüències audiovisuals de cares parlants i seqüències visuals de llengua de signes en àmbit domèstic. En el primer cas, amb animació totalment sincronitzada a través d'una font de text o veu; en el segon, utilitzant la tècnica de lletrejar paraules mitjançant la ma. Les seves possibilitats de personalització faciliten la creació de seqüències audiovisuals per part d'usuaris no experts. Les aplicacions possibles d'aquest esquema de síntesis comprenen des de la creació de personatges virtuals realistes per interacció natural o vídeo jocs fins vídeo conferència des de molt baix ample de banda i telefonia visual per a les persones amb problemes d'oïda, passant per oferir ajuda a la pronunciació i la comunicació a aquest mateix col·lectiu. El sistema permet processar seqüències llargues amb un consum de recursos molt reduït, sobre tot, en el referent a l'emmagatzematge, gràcies al desenvolupament d'un nou procediment de càlcul incremental per a la descomposició en valors singulars amb actualització de la informació mitja. Aquest procediment es complementa amb altres tres: el decremental, el de partició i el de composició. / Se presenta un esquema único para la síntesis y análisis audiovisual personalizable realista de secuencias audiovisuales de caras parlantes y secuencias visuales de lengua de signos en entorno doméstico. En el primer caso, con animación totalmente sincronizada a través de una fuente de texto o voz; en el segundo, utilizando la técnica de deletreo de palabras mediante la mano. Sus posibilidades de personalización facilitan la creación de secuencias audiovisuales por parte de usuarios no expertos. Las aplicaciones posibles de este esquema de síntesis comprenden desde la creación de personajes virtuales realistas para interacción natural o vídeo juegos hasta vídeo conferencia de muy bajo ancho de banda y telefonía visual para las personas con problemas de oído, pasando por ofrecer ayuda en la pronunciación y la comunicación a este mismo colectivo. El sistema permite procesar secuencias largas con un consumo de recursos muy reducido gracias al desarrollo de un nuevo procedimiento de cálculo incremental para la descomposición en valores singulares con actualización de la información media. / A shared framework for realistic and personalizable audiovisual synthesis and analysis of audiovisual sequences of talking heads and visual sequences of sign language is presented in a domestic environment. The former has full synchronized animation using a text or auditory source of information; the latter consists in finger spelling. Their personalization capabilities ease the creation of audiovisual sequences by non expert users. The applications range from realistic virtual avatars for natural interaction or videogames to low bandwidth videoconference and visual telephony for the hard of hearing, including help to speech therapists. Long sequences can be processed with reduced resources, specially storing ones. This is allowed thanks to the proposed scheme for the incremental singular value decomposition with mean preservation. This scheme is complemented with another three: the decremental, the split and the composed ones.

Page generated in 0.1047 seconds