• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 973
  • 346
  • 113
  • 15
  • 10
  • 8
  • 4
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 1551
  • 756
  • 274
  • 259
  • 241
  • 234
  • 231
  • 169
  • 163
  • 155
  • 151
  • 147
  • 141
  • 132
  • 123
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
581

Etude du traitement visuel précoce des objets par la méthode de l'amorçage infraliminaire / Early visual processing of objects : a subliminal priming study

Buchot, Romain 03 April 2014 (has links)
Trois hypothèses principales existent quant aux indices locaux du contour étant les plus informatifs pour le processus de structuration de la forme, et permettant l’identification visuelle des objets : les angles et les indices de tridimensionnalité (Biederman, 1987 ; Boucart et al, 1995), les éléments mi-segments (Kennedy & Domander, 1985, Singh & Fulvio, 2005), et l’interaction entre le type de fragmentation et le degré de spécificité de la forme globale (Panis & Wagemans, 2009). L’objectif de ce travail consiste donc à confronter ces trois hypothèses, en tentant de déterminer par ailleurs le niveau (conscient ou non conscient) auquel s’opèrent la détection et le traitement de ces indices. Les paradigmes d’amorçage supra et infraliminaire sont employés. Des dessins d’objets fragmentés selon deux modes (angles et indices de tridimensionnalité versus éléments mi-segments) sont insérés en tant qu’amorce, précédant une image cible du même objet, elle-même fragmentée et présentant des zones de contours strictement identiques ou complémentaires à l’amorce. Aucune des quatre expériences proposées ne met en évidence un effet « qualitatif » du type de fragmentation. En revanche, certaines conditions temporelles permettent un effet d’amorçage de type lié à la quantité de contour présenté. Nos résultats confirment l’ambiguïté émergeant de la littérature relative aux zones de contours les plus informatives, et semblent conforter la nécessité d’un haut degré d’automaticité des processus impliqués dans la perspective de mettre en évidence des effets d’amorçage perceptif / Three main hypotheses exist concerning the most informative local features of contour for binding processes, allowing visual object identification: vertices and 3D features (Biederman, 1987 ; Boucart et al, 1995), midsegments elements (Kennedy R& Domander, 1985, Singh & Fulvio, 2005), and the interaction betweenfragmentation type and complexity of the global form (Panis & Wagemans, 2009). The aim of this work is to confront these hypotheses, while trying to determine the level (conscious or unconscious) at which the detection and the processing of these features occur. Conscious and unconscious priming paradigms are employed. Drawings of fragmented objects contain either vertices and 3D features or midsegment elements. They are used as primes, preceding a fragmented target image of the same object containing identical or complementary contour features. None of these four experiments highlight a qualitative effect of fragmentation types. However, a quantitative priming effect can be observed under certain timing conditions. Our results confirm the ambiguity emerging from literature concerning the most informative contour features and the necessity of a high degree of automatism of the processes involved in order to highlight perceptual priming effects
582

Reconnaissance de mots écrits assistée par ordinateur pour favoriser la production orale d’enfants non-verbaux avec autisme / Computer assisted recognition of written words to facilitate speech in non-verbal children with autism

Vernay, Frédérique 16 April 2013 (has links)
Cette thèse vise à étudier expérimentalement les effets de différents types de médiations visuelles (photographies, mots écrits, mots écrits présentés de manière segmentée selon un découpage syllabique) présentées sous format numérique qui pourraient favoriser l'émergence d'une production orale chez des enfants non-verbaux avec autisme. Elle s'inscrit dans une approche respectueuse du fonctionnement cognitif connu des personnes avec autisme, à savoir leur meilleure gestion des informations visuelles qu'auditives mais aussi leur attrait certain pour l'outil informatique et plus particulièrement des stimuli visuels présentés par l'intermédiaire d'un écran, ainsi que leurs difficultés à traiter l'information rapide dynamique. Quatre expérimentations ont été réalisées, mettant les participants dans des situations où ils devaient reconnaître des mots écrits, y associer leur correspondance orale ainsi que leur référent, et les utiliser ensuite comme outil de médiation à la production orale. Les résultats mettent en évidence les capacités des enfants non-verbaux avec autisme à reconnaître des mots écrits et le recours à différents traitements selon qu'ils disposent ou non d'un modèle pour ce faire. Ils montrent également qu'une auto-présentation segmentée de ces mots écrits facilite la perception des syllabes constitutives des mots et leur production orale par ces enfants non-verbaux avec autisme. Au total, ces résultats ouvrent des pistes de travail pour envisager de nouvelles médiations pédagogiques et rééducatives dans le domaine de la production orale, adaptées aux capacités cognitives des enfants avec autisme. / This thesis aims at studying the effects of various types of visual media, (photos, written words, and written words made up by their individual syllables) presented in a digital format, which can facilitate speech in non-verbal children with autism.It combines an approach by recognizing the cognitive abilities, and difficulties of managing heard information for these children. This is best done by using a computer, which can present the heard information in a visual manner, such that the information can be slowed down to a speed which can be best managed and assimilated by the children.Four experiments were done, placing the participants in situations that allowed them to recognize written words and their associated syllables in the formation of speech. The results bring to light not only the capacities of these non-verbal children with autism to recognize written words, but also their ability to identify and produce the presented segmented words as individual syllables.These results present some guidelines for educational institutions working in the field of oral language, and more specifically to those related to the cognitive capacities of children with autism.
583

Prise en charge des vieillissements, solidarité sociale et intergénérationnelle. : Le cas d’un EHPAD privé comme entité collective.

Loffeier, Iris 13 June 2013 (has links)
À l’intersection entre différentes spécialités sociologiques, cette recherche vise à saisir les normes qui contribuent à construire la catégorie des personnes âgées dans l’un des lieux extrêmes de sa « mise en problème » : la maison de retraite. Une pluralité de savoirs spécifiques (médicaux, psychologiques, sociologiques…), se réunit et trouve son application à l’intérieur de ces « domiciles de substitution ». En s’appuyant sur des données discursives issues d’entretiens avec les professionnels et de documents officiels, mais également d’une observation participante dans un EHPAD, l’enquête cherche à analyser les liens entre connaissance, normes et (re)production de l’ordre interactionnel impliquant des personnes âgées. Cet ordre interactionnel se définit à plusieurs niveaux. D’une part, des normes formelles font l’objet d’un travail politique et de production par une instance nationale nouvelle : l’Anesm, qui édite depuis 2008 des « guides de bonnes pratiques professionnelles ». D’autre part, des normes et des règles sont produites en situation à l’intérieur de l’établissement. Cette recherche vise à toucher plus largement la question de l’inscription sociale des personnes âgées, dans le cadre de la constitution d’un lien social intergénérationnel en maison de retraite. La « protection » des personnes ne peut en effet se penser indépendamment de celle des travailleurs à qui il incombe de produire leur « bien être » tandis que les normes qui conduisent cette production se révèlent parfois contradictoires entre elles. / Combining insight from disparate fields of Sociology, this research has attempted to capture the norms that contribute to the categorisation of elderly people in one of the most extreme scenes of its construction: a retirement home. Specific subject areas (medicine, psychology, sociology…) are increasingly coalescing in their understanding of such 'substitutive homes'. Based on a qualitative enquiry that includes participant observation and formal interviews, this research attempts to analyse the links between knowledge, normativity, and the (re)production of an interactional order including elderly people. This interactional order defines itself at several levels. On the one hand, it is subject to legal elaboration and through the creation of a new agency officially dedicated to it : l’Anesm, which has edited good practice guides since 2008. On the other hand, norms and rules are defined through situations within the institution itself. This research aims to grasp the wider significance of the social prescription of the elderly, as framed by an intergenerational link between carers and patrons in retirement homes. Indeed, it is the contention of this work that, the political 'protection' of the elderly cannot be considered separately from the interests of the workers who care for them, as the norms driving this protection are shown to reveal themselves as sometimes being quite contradictory.
584

Enhanced image and video representation for visual recognition / Représentations d'image et de vidéo pour la reconnaissance visuelle

Jain, Mihir 09 April 2014 (has links)
L'objectif de cette thèse est d'améliorer les représentations des images et des vidéos dans le but d'obtenir une reconnaissance visuelle accrue, tant pour des entités spécifiques que pour des catégories plus génériques. Les contributions de cette thèse portent, pour l'essentiel, sur des méthodes de description du contenu visuel. Nous proposons des méthodes pour la recherche d'image par le contenu ou par des requêtes textuelles, ainsi que des méthodes pour la reconnaissance et la localisation d'action dans des vidéos. En recherche d'image, les contributions se fondent sur des méthodes `a base de plongements de Hamming. Tout d'abord, une méthode de comparaison asymétrique vecteur-`a-code est proposée pour améliorer la méthode originale, symétrique et utilisant une comparaison code-`a-code. Une méthode de classification fondée sur l'appariement de descripteurs locaux est ensuite proposée. Elle s'appuie sur une classification opérée dans un espace de similarités associées au plongement de Hamming. En reconnaissance d'action, les contributions portent essentiellement sur des meilleures manières d'exploiter et de représenter le mouvement. Finalement, une méthode de localisation est proposée. Elle utilise une partition de la vidéo en super-voxels, qui permet d'effectuer un échantillonnage 2D+t de suites de boîtes englobantes autour de zones spatio-temporelles d'intérêt. Elle s'appuie en particulier sur un critère de similarité associé au mouvement. Toutes les méthodes proposées sont évaluées sur des jeux de données publics. Ces expériences montrent que les méthodes proposées dans cette thèse améliorent l'état de l'art au moment de leur publication. / The subject of this thesis is about image and video representations for visual recognition. This thesis first focuses on image search, both for image and textual queries, and then considers the classification and the localization of actions in videos. In image retrieval, images similar to the query image are retrieved from a large dataset. On this front, we propose an asymmetric version of the Hamming Embedding method, where the comparison of query and database descriptors relies on a vector-to-binary code comparison. For image classification, where the task is to identify if an image contains any instance of the queried category, we propose a novel approach based on a match kernel between images, more specifically based on Hamming Embedding similarity. We also present an effective variant of the SIFT descriptor, which leads to a better classification accuracy. Action classification is improved by several methods to better employ the motion inherent to videos. This is done by dominant motion compensation, and by introducing a novel descriptor based on kinematic features of the visual flow. The last contribution is devoted to action localization, whose objective is to determine where and when the action of interest appears in the video. A selective sampling strategy produces 2D+t sequences of bounding boxes, which drastically reduces the candidate locations. The method advantageously exploits a criterion that takes in account how motion related to actions deviates from the background motion. We thoroughly evaluated all the proposed methods on real world images and videos from challenging benchmarks. Our methods outperform the previously published related state of the art and remains competitive with the subsequently proposed methods.
585

Le devenir des jeunes femmes engagées volontaires dans la guerre du Vietnam / The becoming of young women committed volunteers in the Vietnam War

Kim, Van Chien 26 June 2013 (has links)
Trente cinq ans ont passé depuis la fin de la Guerre du Viêt Nam, mais pour les femmes ex-volontaires le combat continue. Combat pour une vie décente. À leur retour, pour s’intégrer à une vie normale, il leur a fallu dépasser toutes sortes de difficultés: d’abord celles liées à leur état de santé, puis les difficultés économiques, sociales et familiales. Bien que l’État vietnamien ait enfin adopté des mesures en leur faveur, celles-ci se sont révélées impuissantes à améliorer leur niveau de vie et à compenser leurs souffrances. Elles ont donc le sentiment de ne pas avoir été reconnues. Les résultats scientifiques de cette thèse ont montré que le choix altruiste de leur engagement pendant la guerre s’était fait sur une base « rationnelle ». Malgré certains cas d’engagements « forcés », la majorité d’entre elles se sont déterminées à partir d’un intérêt privé: venger la mort d’un proche, obéir à l’esprit révolutionnaire familial, ou goût de l’uniforme, peur du « qu’en-dira-t-on », désir d’indépendance, fuir la pauvreté familiale, laisser un garçon à la maison pour s’occuper des ancêtres et s’engager à sa place. Intérêt d’ordre personnel, familial, économique ou révolutionnaire. Rarement purement patriotique. Sur les champs de bataille, elles ont non seulement aidé les combattants en assumant les transports de munitions, de vivres, de blessés ou les travaux reconstruction des routes, mais elles ont aussi combattu aux côtés des hommes, armes à la main. Nous avons vu l’importance des éléments extérieurs, « exogènes », ayant contribué à leur souffrance, comme l’environnement géographique (montagnes, jungle et présence d’animaux dangereux ou porteurs de maladies); le climat (alternance de pluies ou de sécheresses intenses); les circonstances de guerre (bombardements, produits chimiques, blessures, exposition à la mort) et les circonstances dues aux déplacements (faim, soif, fatigue, épuisement du corps). À leur retour, ces femmes n’ont pas été reconnues. Les traces laissées sur leur corps par la guerre ont gravement perturbé leur intégration: solitude, mariage difficile, santé maladive. Leur faible niveau d’éducation ne leur permettant pas de trouver un emploi correct, c’est donc sur tous les fronts qu’elles ont dû se battre: personnel, familial et professionnel. La société, à ce jour, les distingue en six catégories: mariées, divorcées, séparées, célibataires, sans enfant et sans-abri. C’est ainsi, avec l’ensemble des ex-jeunes volontaires qui réclamaient une identité et des droits particuliers, qu’ils ont d’abord « lutté pour la reconnaissance ». Puis ont participé à la création du Comité de liaison des ex-jeunes volontaires, auquel a succédé l’Association des ex-jeunes volontaires. Cette association a constitué LA nouvelle force motrice. Elle a joué pleinement son rôle d'un témoignage historique, exigeant du Parti et des autorités locales la mise en œuvre de politiques sociales appropriées. Mais ces politiques n’ont répondu que partiellement aux attentes. « Le don et le contre-don » ne sont donc pas équitables, car cette aide demeure très insuffisante et ne touche qu’un nombre restreint de femmes, celles ayant pu conserver durant toutes ces années les fameux papiers justifiant leur engagement, et justifiant leurs blessures. / Thirty five years have passed since the end of the Vietnam War, however, for the women who volunteered, the combat continues. A combat for a decent life. Upon their return, in order to integrate into a normal life, they had to go through many trials: firstly those related to their health conditions, then financial, social and family difficulties. Even though the Vietnamese State adopted measures in their favour, they turned out to be insufficient in improving their lives and compensating their suffering. They thus feel as though they have gone unrecognized. Scientific results of this Thesis have shown their altruist choice of committal to the war was made upon a "rational" basis. Despite certain cases of "forced" involvement, the majority of them were determined to leave out of personal interest: such as the vengeance of loved ones, to obey to the revolutionary family, the taste for a uniform role, fear of being outcast for not participating, a desire for independence, an escape from poverty, wanting to leave one man at home to take care of the ancestors and enrolling in his place, an interest for personnel, family, economic or revolutionary order. Rarely was their enrollment in the army pure patriotism. On the battle field, they not only helped the troops by transporting ammunition, people both well and wounded, they reconstructed the roads and fought beside the men weapons in hand. We have seen the importance of outside elements "exogenous", having contributed to their suffering, such as geographical placement, (mountainous and jungle regions and their contact with animals carrying decease; the climate change and intensified rain and dry seasons; the circumstances of war (chilling, chemical sprays, wounds, regular exposure to death) and the circumstances due to unstable living conditions such as constant movement (hunger, thirst, fatigue, physical exhaustion). Upon their return, these women went unrecognized. The traces left on their bodies by the war had seriously interfered with their reintegration into the society that they left. They returned disease-ridden to solitude, marriage problems and poor health. Their low level of education held them back from employment opportunities, leaving them to continue a new fight, one of a more personal level. The society, to this day, distinguishes them by six categories: those married, divorced, separated, and single, without children and those that are homeless. Thus it is the entire group of ex-volunteers that are seeking an identity along with certain rights as they have justly "fought for recognition" then participated in the creation of the Liaison Committee of ex-volunteers, which led to the succession of the Association ex-volunteers. This association constituted THE new motor force. It has played the role of a historic witness, forcing the Party and local authority's to value more appropriate social politics. However these politics haven't responded to any particular expectations. « The gift and return gift” are not equal, because this help has been largely insufficient and only reaches out to a restricted number of women, those who had kept their paperwork during the risky years of their engagement and those able to justify their wounds.
586

Analyse du façonnage de l'identité professionnelle des enseignants d'école primaire en formation initiale / Analysis of the shaping of professional identity of primary school teachers in training

Zimmermann, Philippe 11 April 2013 (has links)
Cette thèse porte sur l’étude du processus de façonnage de l’identité professionnelle (IP) de professeurs des écoles en formation initiale (PEFI). Usité dans des contextes institutionnels, professionnels et scientifiques, le concept d’IP revêt un caractère polysémique lui conférant toute sa complexité mais aussi tout son intérêt. Le discours institutionnel témoigne d’une préoccupation souvent réaffirmée mais, paradoxalement, d’une quasi-absence d’évocation explicite de l’IP. Au plan scientifique, la multiplicité des modèles théoriques qui définissent l’IP est à l’origine d’une ambiguïté sémantique la caractérisant. En s’inscrivant dans les théories culturalistes (Engeström, 1999 ; Leontiev, 1975 ; Vygotski, 1960), les postulats de la clinique de l’activité (Clot, 1999), de la psychodynamique du travail (Dejours, 1993) et de l’ergonomie (Wisner, 1995), cette thèse apporte un regard nouveau sur le concept d’IP, en l’appréhendant comme une activité de renormalisation des prescriptions reconnue par soi et par autrui. Menée avec six PEFI, la démarche clinique a permis la reconstitution de leurs itinéraires individuels ainsi que le repérage des caractéristiques communes au façonnage de leur IP. Les résultats mettent en exergue l’identification de quatre « bascules », correspondant aux passages par lesquels passent tous les PEFI dans le processus identitaire. Ces bascules rendent compte du caractère dynamique et singulier du façonnage de l’IP. Elles ont conduit à la construction de scénarios individuels du façonnage identitaire qui rompent avec les scénarios-types retrouvés dans nombre d’études. Des propositions pour penser la formation initiale en termes d’IP sont esquissées. / This thesis focuses on the study of the shaping process of the professional identity (PI) of preservice teachers (PT). Usual in institutional, professional and scientific contexts, the concept of PI is of a polysemous character, which gives it all its complexity and interest. The institutional discourse reflects an often reaffirmed concern about PI, but paradoxically, a virtual absence of explicit mention of it. From a scientific standpoint, the multiplicity of theoretical models that define the PI is at the origin of the semantic ambiguity characterizing it. By entering the culturalist theories (Engeström, 1999; Leontiev, 1975; Vygotsky, 1960), the postulates of clinical activity (Clot, 1999), of psychodynamics (Dejours, 1993) and of ergonomics (Wisner, 1995), this thesis provides a new perspective on the concept of PI, analyzing it as an activity to renormalize Prescriptions as recognized by oneself and by others. Conducted with six PT, the clinical approach allows the reconstruction of their individual routes and the identification of common characteristics in shaping their PI. Results highlight the identification of four turning points, corresponding to the steps common to all PT in the PI process. These turning points reflect the dynamic and unique shaping of the PI. They lead to the construction of scenarios shaping individual identity that break with the typical scenarios found in many studies. Proposals for rethinking initial training in terms of PI are outlined.
587

Analyse et reconnaissance des émotions lors de conversations de centres d'appels / Automatic emotions recognition during call center conversations

Vaudable, Christophe 11 July 2012 (has links)
La reconnaissance automatique des émotions dans la parole est un sujet de recherche relativement récent dans le domaine du traitement de la parole, puisqu’il est abordé depuis une dizaine d’années environs. Ce sujet fait de nos jours l’objet d’une grande attention, non seulement dans le monde académique mais aussi dans l’industrie, grâce à l’augmentation des performances et de la fiabilité des systèmes. Les premiers travaux étaient fondés sur des donnés jouées par des acteurs, et donc non spontanées. Même aujourd’hui, la plupart des études exploitent des séquences pré-segmentées d’un locuteur unique et non une communication spontanée entre plusieurs locuteurs. Cette méthodologie rend les travaux effectués difficilement généralisables pour des informations collectées de manière naturelle.Les travaux entrepris dans cette thèse se basent sur des conversations de centre d’appels, enregistrés en grande quantité et mettant en jeu au minimum 2 locuteurs humains (un client et un agent commercial) lors de chaque dialogue. Notre but est la détection, via l’expression émotionnelle, de la satisfaction client. Dans une première partie nous présentons les scores pouvant être obtenus sur nos données à partir de modèles se basant uniquement sur des indices acoustiques ou lexicaux. Nous montrons que pour obtenir des résultats satisfaisants une approche ne prenant en compte qu’un seul de ces types d’indices ne suffit pas. Nous proposons pour palier ce problème une étude sur la fusion d’indices de types acoustiques, lexicaux et syntaxico-sémantiques. Nous montrons que l’emploi de cette combinaison d’indices nous permet d’obtenir des gains par rapport aux modèles acoustiques même dans les cas ou nous nous basons sur une approche sans pré-traitements manuels (segmentation automatique des conversations, utilisation de transcriptions fournies par un système de reconnaissance de la parole). Dans une seconde partie nous remarquons que même si les modèles hybrides acoustiques/linguistiques nous permettent d’obtenir des gains intéressants la quantité de données utilisées dans nos modèles de détection est un problème lorsque nous testons nos méthodes sur des données nouvelles et très variées (49h issus de la base de données de conversations). Pour remédier à ce problème nous proposons une méthode d’enrichissement de notre corpus d’apprentissage. Nous sélectionnons ainsi, de manière automatique, de nouvelles données qui seront intégrées dans notre corpus d’apprentissage. Ces ajouts nous permettent de doubler la taille de notre ensemble d’apprentissage et d’obtenir des gains par rapport aux modèles de départ. Enfin, dans une dernière partie nous choisissons d’évaluées nos méthodes non plus sur des portions de dialogues comme cela est le cas dans la plupart des études, mais sur des conversations complètes. Nous utilisons pour cela les modèles issus des études précédentes (modèles issus de la fusion d’indices, des méthodes d’enrichissement automatique) et ajoutons 2 groupes d’indices supplémentaires : i) Des indices « structurels » prenant en compte des informations comme la durée de la conversation, le temps de parole de chaque type de locuteurs. ii) des indices « dialogiques » comprenant des informations comme le thème de la conversation ainsi qu’un nouveau concept que nous nommons « implication affective ». Celui-ci a pour but de modéliser l’impact de la production émotionnelle du locuteur courant sur le ou les autres participants de la conversation. Nous montrons que lorsque nous combinons l’ensemble de ces informations nous arrivons à obtenir des résultats proches de ceux d’un humain lorsqu’il s’agit de déterminer le caractère positif ou négatif d’une conversation / Automatic emotion recognition in speech is a relatively recent research subject in the field of natural language processing considering that the subject has been proposed for the first time about ten years ago. This subject is nowadays the object of much attention, not only in academia but also in industry, thank to the increased models performance and system reliability. The first studies were based on acted data and non spontaneous speech. Up until now, most experiments carried out by the research community on emotions were realized pre-segmented sequences and with a unique speaker and not on spontaneous speech with several speaker. With this methodology the models built on acted data are hardly usable on data collected in natural context The studies we present in this thesis are based on call center’s conversation with about 1620 hours of dialogs and with at least two human speakers (a commercial agent and a client) for each conversation. Our aim is the detection, via emotional expression, of the client satisfaction.In the first part of this work we present the results we obtained from models using only acoustic or linguistic features for emotion detection. We show that to obtain correct results an approach taking into account only one of these features type is not enough. To overcome this problem we propose the combination of three type of features (acoustic, lexical and semantic). We show that the use of models with features fusion allows higher score for the recognition step in all case compared to the model using only acoustic features. This gain is also obtained if we use an approach without manual pre-processing (automatic segmentation of conversation, transcriptions based on automatic speech recognition).In the second part of our study we notice that even if models based on features combination are relevant for emotion detection the amount of data we use in our training set is too small if we used it on large amount of data test. To overcome this problem we propose a new method to automatically complete training set with new data. We base this selection on linguistic and acoustic criterion. These new information are issued from 100 hours of data. These additions allow us to double the amount of data in our training set and increase emotion recognition rate compare to the non-enrich models. Finally, in the last part we choose to evaluate our method on entire conversation and not only on conversations turns as in most studies. To define the classification of a dialog we use models built on the previous steps of this works and we add two new features group:i) structural features including information like the length of the conversation, the proportion of speech for each speaker in the dialogii) dialogic features including informations like the topic of a conversation and a new concept we call “affective implication”. The aim of the affective implication is to represent the impact of the current speaker’s emotional production on the other speakers. We show that if we combined all information we can obtain results close to those of humans
588

Détection, localisation et typage de texte dans des images de documents hétérogènes par Réseaux de Neurones Profonds / Detection, localization and typing of text in heterogeneous document images with Deep Neural Networks

Moysset, Bastien 28 May 2018 (has links)
Lire automatiquement le texte présent dans les documents permet de rendre accessible les informations qu'ils contiennent. Pour réaliser la transcription de pages complètes, la localisation des lignes de texte est une étape cruciale. Les méthodes traditionnelles de détection de lignes, basées sur des approches de traitement d'images, peinent à généraliser à des jeux de données hétérogènes. Pour cela, nous proposons dans cette thèse une approche par réseaux de neurones profonds. Nous avons d'abord proposé une approche de segmentation mono-dimensionnelle des paragraphes de texte en lignes à l'aide d'une technique inspirée des modèles de reconnaissance, où une classification temporelle connexionniste (CTC) est utilisée pour aligner implicitement les séquences. Ensuite, nous proposons un réseau qui prédit directement les coordonnées des boîtes englobant les lignes de texte. L'ajout d'un terme de confiance à ces boîtes hypothèses permet de localiser un nombre variable d'objets. Nous proposons une prédiction locale des objets afin de partager les paramètres entre les localisations et, ainsi, de multiplier les exemples d'objets vus par chaque prédicteur de boîte lors de l'entraînement. Cela permet de compenser la taille restreinte des jeux de données utilisés. Pour récupérer les informations contextuelles permettant de prendre en compte la structure du document, nous ajoutons, entre les couches convolutionnelles, des couches récurrentes LSTM multi-dimensionnelles. Nous proposons trois stratégies de reconnaissance pleine page qui permettent de tenir compte du besoin important de précision au niveau des positions et nous montrons, sur la base hétérogène Maurdor, la performance de notre approche pour des documents multilingues pouvant être manuscrits et imprimés. Nous nous comparons favorablement à des méthodes issues de l'état de l'art. La visualisation des concepts appris par nos neurones permet de souligner la capacité des couches récurrentes à apporter l'information contextuelle. / Being able to automatically read the texts written in documents, both printed and handwritten, makes it possible to access the information they convey. In order to realize full page text transcription, the detection and localization of the text lines is a crucial step. Traditional methods tend to use image processing based approaches, but they hardly generalize to very heterogeneous datasets. In this thesis, we propose to use a deep neural network based approach. We first propose a mono-dimensional segmentation of text paragraphs into lines that uses a technique inspired by the text recognition models. The connexionist temporal classification (CTC) method is used to implicitly align the sequences. Then, we propose a neural network that directly predicts the coordinates of the boxes bounding the text lines. Adding a confidence prediction to these hypothesis boxes enables to locate a varying number of objects. We propose to predict the objects locally in order to share the network parameters between the locations and to increase the number of different objects that each single box predictor sees during training. This compensates the rather small size of the available datasets. In order to recover the contextual information that carries knowledge on the document layout, we add multi-dimensional LSTM recurrent layers between the convolutional layers of our networks. We propose three full page text recognition strategies that tackle the need of high preciseness of the text line position predictions. We show on the heterogeneous Maurdor dataset how our methods perform on documents that can be printed or handwritten, in French, English or Arabic and we favourably compare to other state of the art methods. Visualizing the concepts learned by our neurons enables to underline the ability of the recurrent layers to convey the contextual information.
589

Perception des émotions non verbales dans la musique, les voix et les visages chez les adultes implantés cochléaires présentant une surdité évolutive / Perception of non verbal emotions before and after cochlear implantation in adults with progressive deafness

Ambert-Dahan, Emmanuèle 11 July 2014 (has links)
Le bénéfice de l’implant cochléaire pour la compréhension de la parole en milieu calme, et même dans certains cas pour des situations auditives complexes telles que les environnements bruyants ou l’écoute de la musique est aujourd’hui connu. Si la compréhension de la parole est nécessaire à la communication, la perception des informations non verbales transmises par la voix de même que des expressions faciales est fondamentale pour interpréter le message d’un interlocuteur. Les capacités de perception des émotions non verbales en cas de surdité neurosensorielle évolutive ont été très peu explorées. Les travaux menés dans cette thèse ont pour objectifs d’évaluer la reconnaissance des émotions non verbales dans les modalités auditive et visuelle afin de mettre en évidence d’éventuelles spécificités chez les adultes présentant une surdité évolutive. Pour cela, nous avons réalisé quatre études comportementales dans lesquelles nous avons comparé leurs performances à celles de sujets contrôles normo-entendants. Nous avons évalué le jugement des émotions portées par la musique, la voix et les visages à partir d’un paradigme expérimental impliquant la reconnaissance de catégories émotionnelles (i.e. joie, peur, tristesse...) et la perception des dimensions de valence et d’éveil de l’émotion exprimée. Les études 1 et 2 ont porté sur la reconnaissance des émotions auditives après implantation cochléaire en examinant tour à tour la reconnaissance des émotions portées par la musique et la reconnaissance de celles portées par la voix. Les études 3 et 4 ont porté sur la reconnaissance des émotions visuelles et, en particulier, des expressions faciales avant et après implantation cochléaire. Les résultats de ces études révèlent l’existence d’un déficit de reconnaissance des émotions plus marqué dans le domaine musical et vocal que facial. Il apparaît aussi une perturbation des jugements d'éveil, les stimuli étant perçus moins excitants par les patients que par les normo-entendants. Toutefois, la reconnaissance des voix et des musiques, bien que limitée, était supérieure au niveau du hasard démontrant les bénéfices de l'implant cochléaire pour le traitement des émotions auditives. En revanche, quelle que soit la modalité étudiée, les jugements de valence n'étaient pas altérés. De manière surprenante, les données de ces recherches suggèrent de plus que, chez une partie des patients testés, la reconnaissance des émotions faciales peut être affectée par la survenue d'une surdité évolutive suggérant les conséquences de la perte auditive sur le traitement des émotions présentées dans une autre modalité. En conclusion, il semblerait que la surdité, de même que l'insuffisance d’informations spectrales transmises par l’implant cochléaire, favorisent l'utilisation de la communication verbale au détriment de la communication non verbale. / While cochlear implantation is quite successful in restoring speech comprehension in quiet environments other auditory tasks, such as communication in noisy environments or music perception remain very challenging for cochlear implant (CI) users. Communication involves multimodal perception since information is transmitted by vocal and facial expressions which are crucial to interpret speaker’s emotional state. Indeed, very few studies have examined perception of non verbal emotions in case of progressive neurosensorial hearing loss in adults. The aim of this thesis was to test the influence of rehabilitation by CI after acquired deafness on emotional judgment of musical excerpts and in non verbal voices. We also examined the influence of acquired post-lingual progressive deafness on emotional judgment of faces. For this purpose, we conducted four experimental studies in which performances of deaf and cochlear implanted subjects were compared to those of normal hearing controls. To assess emotional judgment in music, voices and faces, we used a task that consisted of emotional categories identification (happiness, fear, anger or peacefulness for music and neutral) and dimensional judgment of valence and arousal. The first two studies evaluated emotional perception in auditory modality by successively examining recognition of emotions in music and voices. The two following studies focused on emotion recognition in visual modality, particularly on emotional facial expressions before and after cochlear implantation. Results of these studies revealed greater deficits in emotion recognition in the musical and vocal than visual domains as well as a disturbance of arousal judgments, stimuli being perceived less exciting by CI patients as compared to NH subjects. Yet, recognition of emotions in music and voices, although limited, was performed above chance level demonstrating CI benefits for auditory emotions processing. Conversely, valence judgments were not impaired in music, vocal and facial emotional tests. Surprisingly, results of these studies suggest that, at least for a sub-group of patients, recognition of facial emotions is affected by acquired deafness indicating the consequences of progressive hearing loss in processing emotion presented in another modality. Thus, it seems that progressive deafness as well as the lack of spectral cues transmitted by the cochlear implant might foster verbal communication to the detriment of the non verbal emotional communication.
590

Contribution à l'interprétation d'images et vérification de la consistance d'un graphe / Contribution to image interpretation and graph consistency

Hodé, Yann 12 November 2018 (has links)
Dans cette thèse nous montrons que le raisonnement symbolique associé à la vérification de la consistance d'arc avec propagation de contraintes est un outil efficace pour interpréter les images. Nous montrons dans un premier temps que ce cadre théorique permet de vérifier l'organisation spatiale de différentes composantes d'un objet complexe dans une image. Nous proposons ensuite d'étendre l'utilisation de celui-ci à la reconnaissance sélective des formes décrites par des équations mathématiques, grâce à la notion de consistance d'hyper-arc à deux niveaux de contraintes. La pertinence et la faisabilité de cette approche ont été validées par de multiples tests. En outre, les résultats obtenus sur des images sur-segmentées montrent que la méthode proposée est résistante au bruit, même dans des conditions où les humains (dans certains cas d'agnosie visuelle) peuvent échouer. Ces résultats soutiennent l'intérêt du raisonnement symbolique dans la compréhension de l'image. / In this thesis we show that symbolic reasoning associated with arc consistency checking is an efficient tool for images interpretation. We first show that this theoretical framework makes it possible to verify the spatial organization of different components of a complex object in an image. We then propose to extend the use of this framework to the selective recognition of shapes described by mathematical equations, thanks to the notion of hyper-arc consistency with bi-levels constraint. The relevance and feasibility of this approach have been validated by multiple tests. In addition, the results obtained on over-segmented images show that the proposed method is noise-resistant, even under conditions where humans (in some cases visual agnosia) may fail. These results support the interest of symbolic reasoning in image understanding.

Page generated in 0.0416 seconds