• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 7
  • 5
  • 1
  • Tagged with
  • 13
  • 13
  • 7
  • 5
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Rapprochement de données pour la reconnaissance d'entités dans les documents océrisés / Data matching for entity recognition in ocred documents

Kooli, Nihel 13 September 2016 (has links)
Cette thèse traite de la reconnaissance d'entités dans les documents océrisés guidée par une base de données. Une entité peut être, par exemple, une entreprise décrite par son nom, son adresse, son numéro de téléphone, son numéro TVA, etc. ou des méta-données d'un article scientifique tels que son titre, ses auteurs et leurs affiliations, le nom de son journal, etc. Disposant d'un ensemble d'entités structurées sous forme d'enregistrements dans une base de données et d'un document contenant une ou plusieurs de ces entités, nous cherchons à identifier les entités contenues dans le document en utilisant la base de données. Ce travail est motivé par une application industrielle qui vise l'automatisation du traitement des images de documents administratifs arrivant en flux continu. Nous avons abordé ce problème comme un problème de rapprochement entre le contenu du document et celui de la base de données. Les difficultés de cette tâche sont dues à la variabilité de la représentation d'attributs d'entités dans la base et le document et à la présence d'attributs similaires dans des entités différentes. À cela s'ajoutent les redondances d'enregistrements et les erreurs de saisie dans la base de données et l'altération de la structure et du contenu du document, causée par l'OCR. Devant ces problèmes, nous avons opté pour une démarche en deux étapes : la résolution d'entités et la reconnaissance d'entités. La première étape consiste à coupler les enregistrements se référant à une même entité et à les synthétiser dans un modèle entité. Pour ce faire, nous avons proposé une approche supervisée basée sur la combinaison de plusieurs mesures de similarité entre attributs. Ces mesures permettent de tolérer quelques erreurs sur les caractères et de tenir compte des permutations entre termes. La deuxième étape vise à rapprocher les entités mentionnées dans un document avec le modèle entité obtenu. Nous avons procédé par deux manières différentes, l'une utilise le rapprochement par le contenu et l'autre intègre le rapprochement par la structure. Pour le rapprochement par le contenu, nous avons proposé deux méthodes : M-EROCS et ERBL. M-EROCS, une amélioration/adaptation d'une méthode de l'état de l'art, consiste à faire correspondre les blocs de l'OCR avec le modèle entité en se basant sur un score qui tolère les erreurs d'OCR et les variabilités d'attributs. ERBL consiste à étiqueter le document par les attributs d'entités et à regrouper ces labels en entités. Pour le rapprochement par les structures, il s'agit d'exploiter les relations structurelles entre les labels d'une entité pour corriger les erreurs d'étiquetage. La méthode proposée, nommée G-ELSE, consiste à utiliser le rapprochement inexact de graphes attribués modélisant des structures locales, avec un modèle structurel appris pour cet objectif. Cette thèse étant effectuée en collaboration avec la société ITESOFT-Yooz, nous avons expérimenté toutes les étapes proposées sur deux corpus administratifs et un troisième corpus extrait du Web / This thesis focuses on entity recognition in documents recognized by OCR, driven by a database. An entity is a homogeneous group of attributes such as an enterprise in a business form described by the name, the address, the contact numbers, etc. or meta-data of a scientific paper representing the title, the authors and their affiliation, etc. Given a database which describes entities by its records and a document which contains one or more entities from this database, we are looking to identify entities in the document using the database. This work is motivated by an industrial application which aims to automate the image document processing, arriving in a continuous stream. We addressed this problem as a matching issue between the document and the database contents. The difficulties of this task are due to the variability of the entity attributes representation in the database and in the document and to the presence of similar attributes in different entities. Added to this are the record redundancy and typing errors in the database, and the alteration of the structure and the content of the document, caused by OCR. To deal with these problems, we opted for a two-step approach: entity resolution and entity recognition. The first step is to link the records referring to the same entity and to synthesize them in an entity model. For this purpose, we proposed a supervised approach based on a combination of several similarity measures between attributes. These measures tolerate character mistakes and take into account the word permutation. The second step aims to match the entities mentioned in documents with the resulting entity model. We proceeded by two different ways, one uses the content matching and the other integrates the structure matching. For the content matching, we proposed two methods: M-EROCS and ERBL. M-EROCS, an improvement / adaptation of a state of the art method, is to match OCR blocks with the entity model based on a score that tolerates the OCR errors and the attribute variability. ERBL is to label the document with the entity attributes and to group these labels into entities. The structure matching is to exploit the structural relationships between the entity labels to correct the mislabeling. The proposed method, called G-ELSE, is based on local structure graph matching with a structural model which is learned for this purpose. This thesis being carried out in collaboration with the ITESOFT-Yooz society, we have experimented all the proposed steps on two administrative corpuses and a third one extracted from the web
12

Evolution structurale des céramiques (Si)-B-C sous sollicitations thermomécaniques / Structural changes of CVD (Si)-B-C ceramics under thermomechanical treatments

Pallier, Camille 13 November 2012 (has links)
Les matrices céramiques autocicatrisantes sont constituées d’une alternance de couches de SiC, B-C et Si-B-C, déposées par voie gazeuse (CVD). Les couches borées (Si)-B-C sont amorphes après élaboration et leur structure évolue à haute température (T ≥ 1000 °C). Diverses caractérisations (XRD, spectroscopie Raman, NMR, diffusion des neutrons, XANES) ont permis de préciser la structure locale des céramiques brutes d'élaboration. Celle-ci a par la suite été validée par des simulations par dynamique moléculaire ab initio. Elle est constituée de motifs icosaédriques, similaires à ceux de B4C, mais fautés et reliés entre eux par des environnements tétravalents CB4-xCx et trivalents BC3. Dans le cas des matériaux Si-B-C, cette même phase amorphe forme un continuum incluant des clusters de SiC. L’évolution structurale de ces céramiques sous atmosphère inerte a été étudiée en fonction de la température (1100°C ≤ T ≤ 1400 °C) et du temps (t ≤ 1 h). Le caractère métastable des matériaux induit une cinétique de réorganisation rapide. L'évolution structurale se traduit successivement, à T et t croissants, par l’apparition de carbone libre sp2, la cristallisation de B4C, ainsi que la croissance de nanocristallites de SiC dans les matériaux Si-B-C. Les propriétés mécaniques ont également été caractérisées à haute température à l’aide d’essais sur microcomposites Cf/(Si)-B-Cm. Les matériaux font preuve d’un comportement transitoire complexe et fortement dépendant de la température du fait de leur évolution structurale. / Self-healing matrices are composed of SiC, B-C and Si-B-C multilayers deposited by chemical vapour deposition (CVD). The boron-rich layers (Si)-B-C are amorphous in their as-deposited state but crystallize at high temperature (T ≥ 1000 °C). Various analyses (XRD, Raman spectroscopy, NMR, neutron diffraction, XANES) were used to characterize the local structure of the as-processed and heat-treated ceramics. The local structure of heat-treated ceramics was also confirmed by molecular dynamic ab initio simulations. The structure consists of icosahedral units as in B4C but faulted and connected with each other through tetrahedral CB4-XCX and trigonal BC3 sites. In Si-B-C ceramics, the same amorphous phase forms a continuum embedding SiC clusters. The structural evolution of the ceramics in inert atmosphere were studied as a function of temperature (1100°C ≤ T ≤ 1400 °C) and time (t ≤ 1 h). The metastability of the materials leads to fast kinetics of reorganization. When T and t increase, one observes successively the formation free-sp2 carbon, the crystallization of B4C and, in Si-B-C ceramics, the coarsening of the SiC nanocrystallites. The high temperature mechanical properties have also been assessed by tensile tests on Cf/(Si)-B-Cm microcomposites. The materials undergo a complex transient behaviour which is strongly temperature dependent due to the structural changes.
13

Searching for missing baryons through scintillation / Recherche de baryons cachés avec la scintillation

Habibi, Farhang 15 June 2011 (has links)
L'hydrogène moléculaire diffus et froid peut être l'un des candidats ultimes à la composante baryonique cachée de la Voie Lactée. Nous décrivons une nouvelle voie de recherche de matière transparente dans le disque et le halo galactiques, qui exploite les effets de diffraction et de réfraction de la lumière des étoiles d'arrière-plan. En simulant le retard de phase induit par un milieu turbulent, nous avons calculé la figure d'éclairement sur la terre d'une source étendue pour une bande passante donnée. Nous montrons que dans les cas favorables, la luminosité apparente d'une étoile d'arrière-plan peut être soumise à des fluctuations stochastiques de l'ordre de quelques pour cent sur une échelle de temps caractéristique de quelques minutes. Nous avons recherché de tels effets de scintillation, induits par du gaz moléculaire de nébuleuses visibles (sombres), ainsi que par d'hypothétiques (invisibles) clumpuscules d'hydrogène moléculaire froid du halo, pendant deux nuits avec le détecteur infra-rouge SOFI au foyer du télescope NTT de l'ESO. Parmi les quelques milliers d'étoiles surveillées, nous avons détecté un objet dont les variations sont compatibles avec un fort effet de scintillation à travers une structure turbulente de la nébuleuse B68. Comme par ailleurs aucun effet de scintillation n'a été trouvé vers le Petit Nuage de Magellan, nous sommes en mesure d'établir des limites supérieures sur la contribution des clumpuscules de gaz à la masse du halo galactique. Nous montrons qu'une surveillance à cadence élevée dans la bande visible avec un télescope de diamètre supérieur à quatre mètres équipé d'une caméra à lecture rapide devrait permettre, avec une exposition de quelque millions (d'heures x étoiles), de quantifier ou de borner d'une façon très significative la contribution du gaz moléculaire turbulent au halo Galactique. / Cool molecular hydrogen H2 may be the ultimate possible constituent to the Milky-Way missing baryon. We describe a new way to search for such transparent matter in the Galactic disc and halo, through the diffractive and refractive effects on the light of background stars. By simulating the phase delay induced by a turbulent medium, we computed the corresponding illumination pattern on the earth for an extended source and a given passband. We show that in favorable cases, the light of a background star can be subjected to stochastic fluctuations of the order of a few percent at a characteristic time scale of a few minutes. We have searched for scintillation induced by molecular gas in visible dark nebulae as well as by hypothetical halo clumpuscules of cool molecular hydrogen (H2_He) during two nights, using the NTT telescope and the IR SOFI detector. Amongst a few thousands of monitored stars, we found one light-curve that is compatible with a strong scintillation effect through a turbulent structure in the B68 nebula. Because no candidate were found toward the SMC, we are able to establish upper limits on the contribution of gas clumpuscules to the Galactic halo mass. We show that the short time-scale monitoring of a few 10^6 star _ hour in the visible band with a >4 m telescope and a fast readout camera should allow one to interestingly quantify or constrain the contribution of turbulent molecular gas to the Galactic halo.

Page generated in 0.0816 seconds