• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 58
  • 32
  • 10
  • Tagged with
  • 99
  • 33
  • 30
  • 28
  • 27
  • 25
  • 17
  • 17
  • 16
  • 16
  • 14
  • 14
  • 13
  • 13
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Méthodes robustes pour l'estimation d'illuminants et la prise en compte de la couleur en comparaison d'images / Robust methods for illuminant estimation and color image matching

Mazin, Baptiste 28 March 2014 (has links)
Cette thèse traite de l’utilisation de la couleur en vision par ordinateur. Deux problèmes sont étudiés : - l’estimation d’illuminants, - la mise en correspondance de descripteurs locaux pour la comparaison d’images couleur. Les surfaces achromatiques renvoient un spectre lumineux ayant la même distribution fréquentielle que le spectre de l’illuminant. Les détecter permet donc de recouvrer l'illuminant. En supposant que l’ensemble des couleurs que peut prendre un illuminant est limité (équation de Planck), il est possible de sélectionner les pixels appartenant à une surface potentiellement grise. Une méthode de vote est alors appliquée, permettant de sélectionner un ou plusieurs illuminants. L’algorithme final possède de nombreux avantages : il est efficace, intuitif, ne nécessite pas de phase d’apprentissage et requiert peu de paramètres, qui s’avèrent stables. De plus, la méthode de vote permet de s’adapter aux cas où plusieurs sources lumineuses éclairent la scène photographiée. Les descripteurs locaux sont des outils puissants pour comparer les images. Cependant, le rôle de la couleur dans l’étape d’appariement a fait l’objet de peu d’études. Le problème principal que nous considérons ici est celui de l’apport de la couleur pour l’appariement de descripteurs locaux. Un usage local de la couleur permet-il de désambiguïser les situations où la luminance seule est insuffisante ? Et si oui, dans quelles proportions ? Nous proposons quatre descripteurs permettant de décrire de manière détaillée le contexte local de points clés dans l’optique de les apparier. Les expériences proposées montrent clairement l’apport de la couleur pour la mise en correspondance locale. / This thesis addresses the use of color in image processing and computer vision. Two problems are studied: - illuminant estimation, - local descriptors matching for color images comparison. Achromatic surfaces are defined as surfaces reflecting a spectrum with the same frequency dsitribution than the illuminant. Consequently, revovering these surfaces allows to estimate the illuminant. Assuming that the range of colors taken by an illuminant is limited (Planck equation), it is possible to select the pixels belonging to a potentially gray surface. A voting procedure is then applied to select one or more illuminants. The proposed algorithm has many advantages: it is effective, intuitive, does not rely on a learning phase and requires only few parameters. In addition, the voting procedure can be adapted to handle cases where multiple light sources of different colors illuminate the scene. Local descriptors are powerful tools to compare images. However, few studies concern the influence of color in the matching step. The main problem that we consider here is the contribution of the color matching of local descriptors. Does the local use of color allow to disambiguate situations where the luminance alone is insufficient ? And if so, how much? We propose four descriptors to precisely describe the local context of key points in the matching step. The main idea developed here is that accurate information can only be obtained by describing both the color distributions and transitions between colors. The many experiences presented clearly show the positive contribution of color to the reliability of the local matching.
32

Évaluation de la qualité des documents anciens numérisés

Rabeux, Vincent 06 March 2013 (has links) (PDF)
Les travaux de recherche présentés dans ce manuscrit décrivent plusieurs apports au thème de l'évaluation de la qualité d'images de documents numérisés. Pour cela nous proposons de nouveaux descripteurs permettant de quantifier les dégradations les plus couramment rencontrées sur les images de documents numérisés. Nous proposons également une méthodologie s'appuyant sur le calcul de ces descripteurs et permettant de prédire les performances d'algorithmes de traitement et d'analyse d'images de documents. Les descripteurs sont définis en analysant l'influence des dégradations sur les performances de différents algorithmes, puis utilisés pour créer des modèles de prédiction à l'aide de régresseurs statistiques. La pertinence, des descripteurs proposés et de la méthodologie de prédiction, est validée de plusieurs façons. Premièrement, par la prédiction des performances de onze algorithmes de binarisation. Deuxièmement par la création d'un processus automatique de sélection de l'algorithme de binarisation le plus performant pour chaque image. Puis pour finir, par la prédiction des performances de deux OCRs en fonction de l'importance du défaut de transparence (diffusion de l'encre du recto sur le verso d'un document). Ce travail sur la prédiction des performances d'algorithmes est aussi l'occasion d'aborder les problèmes scientifiques liés à la création de vérités-terrains et d'évaluation de performances.
33

Evaluation des services fourragers et environnementaux des prairies permanentes à partir de la végétation, du milieu et des pratiques de gestion / Evaluation of agronomic and environmental services of permanent grasslands from vegetation, environment and management

Michaud, Audrey 27 June 2011 (has links)
Les prairies permanentes (PP) jouent un rôle agronomique et environnemental important. Cependant, leur faible niveau de subventions, une méconnaissance de leur fonctionnement et un désintérêt de ces surfaces au profit de productions fourragères plus productives ont accéléré leur retournement. Revaloriser ces surfaces dans les systèmes fourragers en mettant notamment en avant les services rendus par les PP est donc un enjeu important. Dans ce cadre, l’objectif de notre étude était d’identifier des descripteurs pédoclimatiques et des pratiques de gestion ainsi que les états de la végétation pertinents pour prédire ces services. Notre approche s’est appuyée sur une démarche en plusieurs étapes : i) identification et caractérisation des services fourragers et environnementaux pertinents pour les PP, ii) identification des critères d’aptitude (valeur nutritive, quantité de nectar disponible…), qui permettent d’évaluer le degré d’atteinte du service, iii) prévision des valeurs de chaque critère d’aptitude à partir des états de la végétation (composition botanique et fonctionnelle) et iv) construction des liens entre les états de la végétation et des descripteurs pédoclimatiques (température, régime hydrique…) et de pratiques de gestion (fertilisation, date de première fauche…). Un travail de bibliographie, d’expertise et d’enquêtes en ferme a permis de sélectionner les services fourragers et environnementaux, les critères d’aptitude, les états de la végétation et les descripteurs pédoclimatiques et des pratiques de gestion. Au total, quatre services environnementaux et 10 services fourragers ont été étudiés, en tenant compte de 12 états de la végétation (composition botanique (présence et dominances en espèces) et fonctionnelle (traits de vie et propriétés des espèces)), de 15 descripteurs pédoclimatiques (température, humidité du sol, …) et 19 descripteurs des pratiques de gestion (fertilisation, intensité d’utilisations de la prairie,...). L’étude d’un réseau national de 190 parcelles nous a permis de montrer que les compositions fonctionnelle et botanique sont non redondantes et influencées par des descripteurs pédoclimatiques et des pratiques de gestion différentes. La composition fonctionnelle est influencée par des descripteurs pédoclimatiques et des pratiques de gestion alors que la composition botanique, qui fait appel à un plus grand nombre de descripteurs, est majoritairement prédite par des descripteurs pédoclimatiques. Les modèles de prévisions sont meilleurs pour la composition botanique que pour la composition fonctionnelle. L’étude de ce réseau ainsi que d’un dispositif en station expérimentale nous ont permis d’évaluer la qualité de prédiction des critères d’aptitude fourragers (production et valeur nutritive) à partir de la composition fonctionnelle (types fonctionnels (TF) de graminées, proportion de graminées, légumineuses et diverses) de la végétation. L’étude, dans un même milieu de trois prairies de composition en TF contrastée confirme sur l’ensemble de la saison de végétation les différences de qualité et de production de la prairie induites par la composition en TF. En revanche, à l’échelle du réseau national de prairies, la composition en TF n’explique qu’une part limitée des variations de qualité et de production observées. D’autres états de la végétation comme les proportions de légumineuses et de plantes diverses, ainsi que le stade moyen de la végétation et la teneur en matière sèche de la prairie contribuent également à expliquer les différences de production et de qualité entre prairies. Enfin une démarche multicritères nous a permis de construire une méthode d’évaluation des services fourragers et environnementaux à partir des critères d’aptitude. / The contribution of permanent grasslands (PG) to agronomic and environmental services is important. However, their low level of subsidies, a lack of knowledge about their management and a disinterest of these surfaces in favour of more productive forage production have accelerated their downturn. The upgrade of these surfaces in forage systems in particular by studying services of PG is an important issue. In this context, the objective of our study was to identify pedoclimatic and management practices descriptors and characteristics of the vegetation relevant to predict these services. Our approach was based on different steps: i) identification and characterization of forage and environmental services relevant to the PG, ii) identification of aptitude criteria (herbage quality, amount of nectar available ...) which allow to assess the degree of achievement of the services, iii) prediction of values for each criterion of aptitude from characteristics of vegetation (botanical and functional composition) and iv) building links between characteristics of vegetation and pedoclimatic (temperature, soil moisture) and management practices (fertilization, date of first cut) descriptors. From the literature survey, expertise and farm surveys we selected the forage and environmental services, the criteria of aptitude, the characteristics of vegetation and pedoclimatic and management practices descriptors. In total, four environmental services and 11 feed services were studied, taking into account the 12 characteristics of the vegetation (botanical composition (presence and dominance of species) and functional composition (life traits and properties of species)), 15 pedoclimatic descriptors (temperature, soil moisture ...) and 19 management practices descriptors (fertilization, intensity of use of grassland...). The study of a national network of 190 grasslands allowed us to show that botanical and functional composition are non-redundant and influenced by different pedoclimatic and management practices descriptors. The functional composition is influenced by pedoclimatic and management practices descriptors while the botanical composition, which uses a larger number of descriptors, is mainly predicted by pedoclimatic descriptors. The model predictions are better for the botanical composition than for the functional composition. The study of this network and of an experiment in control conditions allowed us to evaluate the quality of prediction of criteria of aptitude for forage services from the functional composition (functional types (FT), proportion of grasses, legumes and forbs, middle stage and dry matter content) of the vegetation. The study in a common environment of three grasslands contrasted on FT composition confirms on the whole growth season the differences in quality and production of grassland that are linked to the FT composition. In contrast, at the scale of the national grassland network, FT composition alone is not sufficient to predict the observed differences in production and quality. Other characteristics of vegetation such as the proportion of legumes and forbs, as well as the mean stage of vegetation or the dry matter content also contribute to explain the differences in production and quality between grasslands. Finally, a multicriteria approach allowed us to build an evaluation method of forage and environmental services from the criteria of aptitude.Thus, this thesis work allowed the development of a method to predict the forage and environmental services provided by permanent grasslands from the knowledge of pedoclimatic characteristics, management practices and of simple vegetation criteria
34

Caractérisation de la dynamique des déformations de contours. Application à l’imagerie pelvienne / Characterization of the contour deformation dynamics. Application to the pelvic imaging

Rahim, Mehdi 19 December 2012 (has links)
Cette thèse présente une méthodologie appliquée à la caractérisation de la dynamique de structures déformables sur des séquences temporelles (2D+t). Des indicateurs sont proposés pour estimer la mobilité de formes non-rigides, à partir de leurs contours. Deux approches complémentaires sont développées: En premier lieu, les descripteurs de forme sont utilisés pour quantifier les déformations globales des formes, et pour estimer des repères géométriques spécifiques. La deuxième approche repose sur l'appariement difféomorphique pour déterminer une paramétrisation unifiée des formes, afin de décrire les déformations. Une évaluation permet d'apprécier la qualité des indicateurs en termes de coût algorithmique, de robustesse face aux données altérées, et de capacité à différencier deux séquences.Cette approche de caractérisation est appliquée à des séquences IRM dynamiques de la cavité pelvienne, où les principaux organes pelviens (vessie, utérus-vagin, rectum) ont une grande variabilité morphologique, ils se déplacent et se déforment. Cette caractérisation est validée dans le cadre de deux applications. L'analyse statistique effectuée sur un ensemble de séquences permet de mettre en évidence des comportements caractéristiques des organes, d'identifier des références anatomiquement significatives, et d'aider à l'interprétation des diagnostics des organes. Aussi, dans le contexte de la réalisation d'une modélisation de la dynamique pelvienne patiente-spécifique, la caractérisation vise à évaluer quantitativement la précision de la modélisation, en utilisant l'IRM dynamique comme vérité-terrain. Ainsi, elle apporte des indications sur la correction des paramètres du modèle. / This thesis presents a methodology for the characterization of the dynamics of deformable structures on time-series data (2D+t). Some indicators are proposed in order to estimate non-rigid shape variations from their contours. Two complementary approaches are developed : First, shape descriptors are used to quantify the global deformations of the shapes, and to estimate specific geometric references. The second approach relies on the diffeomorphic mapping to determinate a unified parametrization of the shapes. Then, features are used to describe the deformations locally. Furthermore, the methodology has an evaluation step which consists in the assessment of the quality of the indicators in the algorithmic complexity, in the stability against data with a small variability, and in the ability to differentiate two sequences.The characterization is applied to dynamic MRI sequences of the pelvic cavity, where the main pelvic organs (bladder, uterus-vagina, rectum) have a high morphological variability, they undergo displacements and deformations. The characterization is validated within the context of two applications. Firslty, a statistical analysis is carried out on a set of sequences. It allows to highlight some properties of the organ behaviors, and to identify meaningful anatomical landmarks. The analysis helps also for the automatic interpretation of the organ diagnoses. Secondly, within the context of the development of a patient-specific pelvic dynamics modeling system, the characterization aims at assessing quantitatively the modeling precision. It uses the dynamic MRI as a ground truth. Thereby, it brings some clues about the correction of the model parameters.
35

Développement d'une instrumentation et méthodologie par l'étude des bruits électrochimiques pour le diagnostic des stacks de pile à combustible de type PEMFC / Development of instrumentation and methodology for noise diagnostic of PEMFC stacks

Adiutantov, Nikolai 19 December 2017 (has links)
Le développement de la technologie « piles à combustible » nécessite l'utilisation d'outils de diagnostic adéquats notamment pour le monitoring de l'état de santé des systèmes industriels (stacks) dans les conditions réelles de fonctionnement. L'utilisation des moyens traditionnels de diagnostic nécessite l'arrêt ou la perturbation du fonctionnement du système. Le travail de cette thèse vise le développement d'une approche innovante non intrusive pour le diagnostic des stacks PEM (Proton Exchange Membrane), basée sur la mesure des petites fluctuations électriques (bruits électrochimiques). Pour mesurer les bruits, un système d'acquisition des faibles signaux à haute fréquence a été utilisé sans filtrage analogique préalable. Ces mesures ont été dans le cadre du projet ANR « Propice » pour quatre campagnes de mesures avec la collaboration du FCLAB et du CEA LITEN. Les mesures des bruits électrochimiques, sur plusieurs semaines, ont permis de construire une base de données extrêmement riche. Pour traiter ces données, différents approches statistiques dans le domaine temporel, fréquentiel et tempo-fréquentiel ont été utilisés pour la génération de descripteurs fiables et robustes. Il a été démontré que la mesure des bruits permet d'obtenir une riche signature des stacks PEM dans un vaste domaine fréquentiel. Cette signature reflète les différents phénomènes physico-chimiques et est très sensible aux paramètres de fonctionnement du système. L'évolution de cette signature au court de temps peut être utilisée pour le diagnostic in-situ de d'état de santé des stacks commerciaux dans les conditions réelles de fonctionnement et pour le développement des moyens de pronostic. / Fuel cell technology development requires adequate diagnostic tools, in particular for monitoring the state of health of industrial systems (stacks) under operating conditions. Traditional diagnostic tools require to stop or disrupt the system operating. This thesis aims at the development of an innovative and non-intrusive approach for the diagnostic of PEM (Proton Exchange Membrane) fuel cell stacks. The methodology is based on the measurement of small electrical fluctuations (electrochemical noise). To measure this noise, a high frequency signal acquisition system was used without prior analog filter. These measurements were obtained within the ANR project « Propice » using four measurement campaigns with the collaboration of FCLAB and CEA LITEN. Electrochemical noise Measurements, over several weeks, made it possible to build a rich database. To process these data, different statistical approaches in time, frequency and tempo-frequency domains have been used for the generation of reliable and robust descriptors. It has been shown that the measurement of noise makes it possible to obtain a rich signature of the PEM stacks in a wide frequency range. This signature reflects the various physico-chemical phenomena and it is very sensitive to the operating parameters of the system. The evolution of this signature in short time analysis can be used for an in-situ diagnostic of the state of health of commercial stacks under real operating conditions and for the development of prognostic strategies.
36

Conception d'un dispositif d'acquisition d'images agronomiques 3D en extérieur et développement des traitements associés pour la détection et la reconnaissance de plantes et de maladies

Billiot, Bastien 20 November 2013 (has links)
Dans le cadre de l'acquisition de l'information de profondeur de scènes texturées, un processus d'estimation de la profondeur basé sur la méthode de reconstruction 3D « Shape from Focus » est présenté dans ce manuscrit. Les deux étapes fondamentales de cette approche sont l'acquisition de la séquence d'images de la scène par sectionnement optique et l'évaluation de la netteté locale pour chaque pixel des images acquises. Deux systèmes d'acquisition de cette séquence d'images sont présentés ainsi que les traitements permettant d'exploiter celle-ci pour la suite du processus d'estimation de la profondeur. L'étape d'évaluation de la netteté des pixels passe par la comparaison des différents opérateurs de mesure de netteté. En plus des opérateurs usuels, deux nouveaux opérateurs basés sur les descripteurs généralisés de Fourier sont proposés. Une méthode nouvelle et originale de comparaison est développée et permet une analyse approfondie de la robustesse à différents paramètres des divers opérateurs. Afin de proposer une automatisation du processus de reconstruction, deux méthodes d'évaluation automatique de la netteté sont détaillées. Finalement, le processus complet de reconstruction est appliqué à des scènes agronomiques, mais également à une problématique du domaine de l'analyse de défaillances de circuits intégrés afin d'élargir les domaines d'utilisation / In the context of the acquisition of depth information for textured scenes, a depth estimation process based on a 3D reconstruction method called "shape from focus" is proposed in this thesis. The two crucial steps of this approach are the image sequence acquisition of the scene by optical sectioning and the local sharpness evaluation for each pixel of the acquired images. Two acquisition systems have been developed and are presented as well as different image processing techniques that enable the image exploitation for the depth estimation process. The pixel sharpness evaluation requires comparison of different focus measure operators in order to determine the most appropriate ones. In addition to the usual focus measure operators, two news operators based on generalized Fourier descriptors are presented. A new and original comparison method is developped and provides a further analysis of the robustness to various parameters of the focus measure operators. In order to provide an automatic version of the reconstruction process, two automatic sharpness evaluation methods are detailed. Finally, the whole reconstruction process is applied to agronomic scenes, but also to a problematic in failure analysis domain aiming to expand to other applications
37

Trois perspectives sur le timbre de la flûte traversière : instrumentale, perceptive et computationnelle

Delisle, Julie 06 1900 (has links)
No description available.
38

Cohérence spatiale et prévisibilité potentielle des descripteurs intrasaisonniers de la saison des pluies en Afrique Soudano-Sahélienne : application à la culture du mil dans la région de Niamey / Spatial coherence and potential predictability of intraseasonal descriptors of the rainy season in Soudano-Sahelian Africa : application to the pearl millet crop in Niamey area

Marteau, Romain 28 September 2010 (has links)
Ce travail de thèse a un double objectif : (i) combler le manque de connaissances concernant la cohérence spatiale et la prévisibilité potentielle de descripteurs intrasaisonniers (DIS) de la saison des pluies en Afrique soudano-sahélienne. Les descripteurs retenus sont le cumul saisonnier (S), l’occurrence des jours pluvieux > 1 mm (O), l’intensité moyenne des pluies journalières (I), les dates de démarrage (DSP) et de fin (FSP) de la saison des pluies, la durée moyenne des séquences sèches (DSS) et humides (DSH) ; (ii) documenter la relation climat-agriculture et en particulier celle entre variabilité intrasaisonnière des pluies et rendements, à partir de l’exemple de la culture du mil dans la région de Niamey. À partir des enregistrements pluviométriques journaliers (1950-2000) issus de la base FRIENDAOC documentant un réseau de 136 stations localisées au Sénégal, Mali, Burkina Faso et Niger, la cohérence spatiale à l’échelle interannuelle, a été estimée par divers scores statistiques (DOF, var[SAI], ACP, corrélations). Elle apparaît contrastée entre les descripteurs intrasaisonniers. Les anomalies de cumul saisonnier et d’occurrence des jours pluvieux > 1 mm présentent une forte cohérence spatiale d’une année sur l’autre. À l’inverse, la cohérence spatiale les anomalies interannuelles de l intensité moyenne des pluies journalières, des dates de démarrage et de fin de la saison des pluies, et de la durée moyenne des séquences sèches et humides est faible. Ainsi, le signal interannuel régional du cumul saisonnier semble principalement lié à une modulation systématique en phase de l’occurrence des jours pluvieux > 1 mm. La prévisibilité potentielle de S, O, DSP et FSP, estimée à partir des précipitations issues de 24 simulations du MCG ECHAM 4.5 forcé par les TSO historiques, est faible. Par contre, l'application de modèles statistico-dynamiques basés sur les précipitations ou la dynamique atmosphérique simulées permet d'améliorer les scores de performance pour le cumul saisonnier et l’occurrence des jours de pluies > 1 mm.Enfin, à partir d’enquêtes et de suivis menés en milieu agricole sur la culture du mil, ainsi que d’enregistrements pluviométriques journaliers sur l’observatoire AMMA-CATCH Niger entre 2004 et 2007, une analyse de la relation entre date de semis, date de démarrage de la saison des pluies et rendements finaux a été réalisée. Les résultats montrent que (i) la plupart des agriculteurs attendent le premier événement pluvieux recueillant au moins 10 mm en deux jours pour semer ; (ii) les vagues de semis sont généralement synchronisées sur le démarrage méso-échelle de la saison des pluies plutôt que sur le démarrage agronomique et (iii) la sensibilité du rendement en grains, testée à partir de simulations du modèle agronomique SARRA-H, pour différentes dates de semis (semis observé, date de démarrage de la saison des pluies), est faible. / The aim of this thesis is twofold : (i) fill a lack of knowledge about the spatial coherence and seasonal predictability of the intraseasonal characteristics (ISC) of the soudano-sahelian rainy season. These ISC are the seasonal rainfall amount (S), the daily rainfall frequency > 1 mm (O), the daily rainfall mean intensity (I), the dates of the onset and withdrawal of the rainy season, the mean length of the dry (LDS) and/or wet spells (LWS) ; (ii) document the climate-agriculture relationship over the Niamey area based on the millet crop example.From FRIEND-AOC daily rainfall records (1950-2000) for a 136 stations-network located in Senegal, Mali, Burkina-Faso and Niger, the spatial coherence, estimated through DOF, var[SAI], EOF, correlation, is not equivalent between the intra-seasonal characteristics. Seasonal rainfall and daily rainfall frequency anomalies have a substantial interannual spatial coherence. Conversely, the spatial coherence of daily mean intensity, onset and withdrawal dates of the rainy season and mean length of dry/wet spells interannual anomalies is weak. Consequently, the regional signal of the seasonal amount interannual variability seems mainly related to the in-phase modulation of the daily rainfall frequency. Potential predictability of seasonal amount, daily rainfall frequency, onset and withdrawal dates of the rainy season estimated from a 24-member ensemble of simulations made with the ECHAM 4.5 GCM forced by observed SSTs, is poor. On the other hand, the use of a model output statistics approached based on simulated rainfall or atmospheric dynamics enhances the skill of the seasonal amount and daily rainfall frequency hindcasts.Lastly, the relationship between the sowing date – rainy season onset date – and yield has been analysed using data collected from on-farm surveys of pearl millet crops, and rain-gauges records between 2004 to 2007 over the AMMA-CATCH Niger supersite. Results show that: (i) most of the farmers wait for the first rainy event greater than 10 mm to sow; (ii) the sowing waves are usually synchronized with the mesoscale onset date rather than the agronomic onset date; (iii) the sensitivity of grain yields, evaluated from SARRA-H crop model simulations initialized with different sowing dates (i.e. observed sowing date, agronomic and hydrologic onset date), is weak.
39

Analyse acoustique de la voix émotionnelle de locuteurs lors d’une interaction humain-robot / Acoustic analysis of speakers emotional voices during a human-robot interaction

Tahon, Marie 15 November 2012 (has links)
Mes travaux de thèse s'intéressent à la voix émotionnelle dans un contexte d'interaction humain-robot. Dans une interaction réaliste, nous définissons au moins quatre grands types de variabilités : l'environnement (salle, microphone); le locuteur, ses caractéristiques physiques (genre, âge, type de voix) et sa personnalité; ses états émotionnels; et enfin le type d'interaction (jeu, situation d'urgence ou de vie quotidienne). A partir de signaux audio collectés dans différentes conditions, nous avons cherché, grâce à des descripteurs acoustiques, à imbriquer la caractérisation d'un locuteur et de son état émotionnel en prenant en compte ces variabilités.Déterminer quels descripteurs sont essentiels et quels sont ceux à éviter est un défi complexe puisqu'il nécessite de travailler sur un grand nombre de variabilités et donc d'avoir à sa disposition des corpus riches et variés. Les principaux résultats portent à la fois sur la collecte et l'annotation de corpus émotionnels réalistes avec des locuteurs variés (enfants, adultes, personnes âgées), dans plusieurs environnements, et sur la robustesse de descripteurs acoustiques suivant ces quatre variabilités. Deux résultats intéressants découlent de cette analyse acoustique: la caractérisation sonore d'un corpus et l'établissement d'une liste "noire" de descripteurs très variables. Les émotions ne sont qu'une partie des indices paralinguistiques supportés par le signal audio, la personnalité et le stress dans la voix ont également été étudiés. Nous avons également mis en oeuvre un module de reconnaissance automatique des émotions et de caractérisation du locuteur qui a été testé au cours d'interactions humain-robot réalistes. Une réflexion éthique a été menée sur ces travaux. / This thesis deals with emotional voices during a human-robot interaction. In a natural interaction, we define at least, four kinds of variabilities: environment (room, microphone); speaker, its physic characteristics (gender, age, voice type) and personality; emotional states; and finally the kind of interaction (game scenario, emergency, everyday life). From audio signals collected in different conditions, we tried to find out, with acoustic features, to overlap speaker and his emotional state characterisation taking into account these variabilities.To find which features are essential and which are to avoid is hard challenge because it needs to work with a high number of variabilities and then to have riche and diverse data to our disposal. The main results are about the collection and the annotation of natural emotional corpora that have been recorded with different kinds of speakers (children, adults, elderly people) in various environments, and about how reliable are acoustic features across the four variabilities. This analysis led to two interesting aspects: the audio characterisation of a corpus and the drawing of a black list of features which vary a lot. Emotions are ust a part of paralinguistic features that are supported by the audio channel, other paralinguistic features have been studied such as personality and stress in the voice. We have also built automatic emotion recognition and speaker characterisation module that we have tested during realistic interactions. An ethic discussion have been driven on our work.
40

Document image segmentation : content categorization / Analyse d'images de documents : segmentation du contenu

Felhi, Mehdi 10 July 2014 (has links)
Dans cette thèse, nous abordons le problème de la segmentation des images de documents en proposant de nouvelles approches pour la détection et la classification de leurs contenus. Dans un premier lieu, nous étudions le problème de l'estimation d'inclinaison des documents numérisées. Le but de ce travail étant de développer une approche automatique en mesure d'estimer l'angle d'inclinaison du texte dans les images de document. Notre méthode est basée sur la méthode Maximum Gradient Difference (MGD), la R-signature et la transformée de Ridgelets. Nous proposons ensuite une approche hybride pour la segmentation des documents. Nous décrivons notre descripteur de trait qui permet de détecter les composantes de texte en se basant sur la squeletisation. La méthode est appliquée pour la segmentation des images de documents numérisés (journaux et magazines) qui contiennent du texte, des lignes et des régions de photos. Le dernier volet de la thèse est consacré à la détection du texte dans les photos et posters. Pour cela, nous proposons un ensemble de descripteurs de texte basés sur les caractéristiques du trait. Notre approche commence par l'extraction et la sélection des candidats de caractères de texte. Deux méthodes ont été établies pour regrouper les caractères d'une même ligne de texte (mot ou phrase) ; l'une consiste à parcourir en profondeur un graphe, l'autre consiste à établir un critère de stabilité d'une région de texte. Enfin, les résultats sont affinés en classant les candidats de texte en régions « texte » et « non-texte » en utilisant une version à noyau du classifieur Support Vector Machine (K-SVM) / In this thesis I discuss the document image segmentation problem and I describe our new approaches for detecting and classifying document contents. First, I discuss our skew angle estimation approach. The aim of this approach is to develop an automatic approach able to estimate, with precision, the skew angle of text in document images. Our method is based on Maximum Gradient Difference (MGD) and R-signature. Then, I describe our second method based on Ridgelet transform.Our second contribution consists in a new hybrid page segmentation approach. I first describe our stroke-based descriptor that allows detecting text and line candidates using the skeleton of the binarized document image. Then, an active contour model is applied to segment the rest of the image into photo and background regions. Finally, text candidates are clustered using mean-shift analysis technique according to their corresponding sizes. The method is applied for segmenting scanned document images (newspapers and magazines) that contain text, lines and photo regions. Finally, I describe our stroke-based text extraction method. Our approach begins by extracting connected components and selecting text character candidates over the CIE LCH color space using the Histogram of Oriented Gradients (HOG) correlation coefficients in order to detect low contrasted regions. The text region candidates are clustered using two different approaches ; a depth first search approach over a graph, and a stable text line criterion. Finally, the resulted regions are refined by classifying the text line candidates into « text» and « non-text » regions using a Kernel Support Vector Machine K-SVM classifier

Page generated in 0.0601 seconds