• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 5001
  • 2031
  • 521
  • 206
  • 39
  • 18
  • 16
  • 14
  • 7
  • 5
  • 3
  • 3
  • 2
  • 2
  • 2
  • Tagged with
  • 7998
  • 1351
  • 1236
  • 992
  • 900
  • 784
  • 749
  • 730
  • 678
  • 606
  • 594
  • 527
  • 504
  • 461
  • 454
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
291

Návrh nového konstrukčního systému pro dřevostavby : přílohy

Veselý , Vojtěch January 2010 (has links)
No description available.
292

RELAÇÃO ENTRE PRECIPITAÇÃO E TURBIDEZ EM CURSOS D ÁGUA NO ESPÍRITO SANTO

PENEDO, P. H. S. 28 August 2015 (has links)
Made available in DSpace on 2016-08-29T15:37:14Z (GMT). No. of bitstreams: 1 tese_9152_Dissertação Pedro Penedo.pdf: 14665408 bytes, checksum: 299e8ef4a5e1fcbdb0e7a62a0118d5d8 (MD5) Previous issue date: 2015-08-28 / Objetivou-se com a realização deste trabalho avaliar a relação entre a turbidez e características morfométricas e de uso do solo em 50 bacias hidrográficas no Estado do Espírito Santo. Foram selecionados 50 pontos de adução de água bruta operados pela Companhia Espírito Santense de Saneamento (CESAN) para tratamento e fornecimento à rede de abastecimento público. Para controle do processo de tratamento e dosagem de reagentes, dados de turbidez são coletados periodicamente. Neste estudo foi utilizado médias mensais de turbidez de 48 meses, de Janeiro de 2006 a Dezembro de 2008. As bacias hidrográficas foram delimitadas com a utilização de um modelo digital de elevação hidrologicamente consistido, obtido em ambiente SIG, bem como as respectivas características morfométricas. Os dados de precipitação média mensal de estações pluviométricas referentes ao período foram espacializados utilizando a técnica geoestatística krigagem ordinária. Os dados de uso do solo são oriundos do banco de dados do Instituto Estadual do Meio Ambiente IEMA e da base de dados geográficos do Estado do Espírito Santo Geobases. Foi realizada a análise de regressão entre a turbidez e a precipitação em todas as bacias, resultando em equações com r2 variando entre 0,90 e 0,015. Após eliminação de variáveis independentes com alto coeficiente de correlação entre si, para redução da multicolinearidade, aplicou-se a técnica de análise de agrupamento hierárquico para agrupar as bacias quanto as características morfométricas e de uso de solo similares. Foi realizada a análise de correlação parcial entre as variáveis nos grupos obtidos, para avaliação de sua influencia na turbidez. Foi realizada a análise de regressão múltipla entre as variáveis e a turbidez nos grupos obtidos, resultando em equações ajustadas com r2 entre 0,68 e 0,16. As variações da interação da precipitação, das características morfométricas e de uso do solo com os níveis de turbidez que ocorrem em escala sub-mensal não puderam ser percebidos, o que pode ter contribuído para a imprecisão dos modelos ajustados. Palavras-chave: bacias hidrográficas; análise de agrupamento; correlação parcial.
293

Comportement hygromécanique de tubes composites obtenus par enroulement filamentaire en immersion et soumis à différentes températures / Hygromechanical behavior of filament wound composite tubes in immersion and subjected to different temperatures

Ibrahim, Georgina 10 November 2017 (has links)
Les structures étudiées sont des tubes en fibres de verre ou de carbone imprégnés de résine époxy et mis en oeuvre par enroulement filamentaire. Ces tubes sont immergés à différentes températures et on étudie leur comportement hygro-thermo-mécanique à l’aide d’essais de caractérisation et de modélisations tenant compte de différents schémas de diffusion. En premier lieu, la morphologie du matériau est analysée par microscopie et microtomographie aux rayons X. Elle révèle des porosités parfois importantes qui influent sur la cinétique de diffusion des matériaux. Une caractérisation mécanique à l’aide d’essais sur tubes sollicités en pression avec et sans effet de fond permet de mettre en évidence une grande variabilité du champ de déformation à la surface des tubes. En complément, des analyses par DMA permettent de quantifier l’effet du vieillissement sur les propriétés mécaniques des matériaux. Plusieurs protocoles expérimentaux sont mis en place afin de quantifier l’effet des contraintes de fabrication et de service sur la diffusion et sur la dilatation hygroscopique des matériaux employés. On étudie la cinétique de reprise en eau et les variations dimensionnelles d’anneaux composites et de tubes sous pression. On constate un ensemble de réponses dépendant du type de fibre de renfort et de la température de vieillissement. On discute de la pertinence de la loi d’Arrhenius afin d’exprimer le coefficient de diffusion en fonction de la température pour les essais d’immersion. Des modélisations de la cinétique de diffusion basées sur la loi de Fick sont identifiées et améliorées afin de mieux représenter les expériences. / The structures studied are tubes made of fiberglass or carbon impregnated with epoxy resin and manufactured by filament winding. These tubes are immersed at different temperatures and their hygrothermomechanical behavior is studied by means of characterization tests taking various diffusion patterns into account. First, the morphology of the material is analyzed by microscopy and X-ray micro-tomography. It reveals porosities which may affect significantly the diffusion kinetics of materials. Mechanical characterization by means of pressuretested tube tests with and without background effect makes it possible to demonstrate a great variability of the strain field at the surface of the tubes. In addition, DMA analyzes allow to quantify the effect of aging on the mechanical properties of materials. Several experimental protocols are set up to quantify the effect of manufacturing and service stress state on the diffusion and moisture expansion of the materials used. The kinetics of water absorption and geometric variations of composite rings and pressure tubes are studied. A set of responses is observed depending on the type of reinforcing fiber and the aging temperature. The relevance of Arrhenius' law is discussed in order to express the diffusion coefficient as a function of temperature for immersion tests. Diffusion kinetics models based on Fick's law are identified and improved to better represent the experiments.
294

Development of On-Tissue Mass Spectrometric Strategies for Protein Identification, Quantification and Mapping / Développements de stratégies de spectrométrie de masse sur tissu pour l’identification, la quantification et la cartographie

Quanico, Jusal 11 July 2014 (has links)
L’imagerie par spectrométrie de masse est une technique sans marquage permettant la détection et la localisation de protéines à partir de coupes de tissus. Afin de répondre à des problématiques biologiques, le nombre de protéines identifiées doit être amélioré. Une stratégie consiste à réaliser une micro-jonction liquide sur des régions particulières des coupes de tissus afin d’extraire les peptides issus de la digestion in situ des protéines. Plus de 1500 protéines ont identifié sur une zone de 650µm, correspondant à environ 1900 cellules. Une corrélation entre ces données avec celles générées par MSI a augmenté le nombre de protéines localisées. Afin d’obtenir dans le même temps, la localisation et l’identification de protéines, une méthode consiste à réaliser la microdissection de l’ensemble de la coupe après l’avoir déposée sur une lame recouverte de parafilm. PAM a également été appliquée à l’étude de l'expression différentielle de protéines dans des tumeurs de prostate. Les résultats ont permis d’identifier des biomarqueurs potentiels tels que des protéines complexées avec des petits ARN nucléolaires. Enfin, la faisabilité des méthodes MS appliquées à l’étude structurale de protéines, tel que l'échange deutérium ou le pontage chimique, ont été examinés directement sur tissu. Les résultats préliminaires suggèrent qu’une étude structurale de protéines est possible afin de déterminer des changements de structures entrainés par la modification du microenvironnement. Réunis ensemble, ces méthodes MS d'analyses directes fournissent un moyen robuste d’étude de protéines dans leur état natif afin de fournir des indications sur leur rôle dans des systèmes biologiques. / Mass spectrometry-based methods for direct tissue analysis, such as MS imaging, are label-free techniques that permit the detection and localization of proteins on tissue sections. There is a need to improve the number of protein identifications in these techniques for them to comprehensively address biological questions. One strategy to obtain high protein IDs is to realize liquid microjunction on localized regions of tissue sections to extract peptides from the in situ digestion of proteins. More than 1500 proteins were identified in a 650µm spot, corresponding to about 1900 cells. Matching these IDs with those from MSI increased the number of localized proteins. In order to achieve simultaneous identification and localization of proteins, a method consisting of microdissecting entire tissue sections mounted on parafilm-covered slides was developed. Spectral counting was then used to quantify identified proteins, and the values were used to generate images. PAM was also used to examine the differential expression of proteins on prostate tumors. Results identified potential biomarkers such as proteins in complex with small nucleolar ribosomal RNAs. Lastly, the feasibility of applying MS methods of structural analysis, such as deuterium exchange and crosslinking, directly on tissue was examined. Preliminary results suggest the possibility of this approach, which could be significative by permiting the determination of protein structural changes for a given microenvironment. Taken together, these direct MS analysis methods provide a robust means of analyzing proteins in their native state and are expected to provide insights to their role in biological systems.
295

Nouveaux matériaux vitreux dopés par des ions ou des nanoparticules métalliques et destinés à la réalisation de fibres optiques / New vitreous materials doped with ions and metallic nanoparticles for optical fiber manufacturing

Le Rouge, Antoine 16 December 2013 (has links)
Ce travail de thèse porte sur l'étude de nouveaux matériaux vitreux, dopés par des ions bismuth ou des nanoparticules d’or, à destination de l’optique guidée. L’efficacité optique dans l’infrarouge des composants réalisés avec des verres dopés bismuth sont limitées par la méconnaissance du centre émetteur. Nous étudions ici les propriétés de luminescence d’un système plus simple : la silice pure. L’évolution des propriétés spectroscopiques, avec la température, d’une fibre optique micro-structurée à cœur de silice dopée bismuth est étudiée. Nous en déduisons les énergies de vibration du centre émetteur. L’influence de l’atmosphère de fabrication de préformes sur leurs propriétés spectroscopiques a ensuite été établie. Un procédé de fabrication de préformes par déposition chimique en phase vapeur (MCVD) est utilisé pour synthétiser des préformes sous atmosphères contrôlées. Les propriétés optiques de ces préformes et fibres optiques conventionnelles sont présentées. Ces résultats corroborent la présence dans la silice d’un centre émetteur dans l’infrarouge lié à une entité réduite du bismuth. Nous étudions alors les propriétés optiques linéaires et non-linéaires de verres massifs et de fibres optiques dopés par des nanoparticules d’or. Leur résonance plasmonique de surface est mise à profit pour fabriquer un verre dont le coefficient non-linéaire est supérieur à celui de la silice. Des monolithes de silice Sol-Gel dopée et densifiée à des températures basses sont utilisés pour la réalisation de fibres optiques micro-structurées. Nous observons un comportement d’absorbant saturable pour le verre massif alors que la fibre optique présente un comportement de limitation optique. / This thesis concerns the properties of two chemical elements which are bismuth ion and gold nanoparticles, for silica doped optical fiber. Efficiency device set up with bismuth doped silica fibers are limited by the misunderstanding of the infrared luminescent center. To this aim, we decided to use the stack and draw process to realize a microstructured optical fiber with a silica core doped only with bismuth. Evolution of spectroscopic properties of the optical fiber versus temperature is reported. We employed a model to deduce vibrational energies of the luminescent center. In a second time, we studied influence of the manufacturing atmosphere of Bismuth doped optical preforms on their spectroscopic properties. A chemical vapor deposition is use with more or less atmosphere during collapse step. Spectroscopic properties of bismuth doped silica preform are presented and discussed. All these results seem to confirm the presence in bismuth doped silica glass of a low valence state or a reduce species of the bismuth element. The second study concerns the linear and nonlinear properties of gold nanoparticles doped bulk glasses and optical fibers. In this work, we propose to start from monolithic silica xerogel with controlled porosity. It is then possible to obtain gold nanoparticles-doped glasses that can be used for the realization of micro-structured fibers using the Stack and Draw technique. Linear and nonlinear properties of bulk glass and optical fibers are studied. We will also present the properties the bulk glass that behaves like a saturable absorber and the optical fiber which presents optical limitation.
296

Dépôt de film multicouche sur surface textile pour la libération prolongée de principes actifs / Multilayered textile coating for drug delivery application

Martin, Adeline 11 October 2013 (has links)
Les textiles sont utilisés dans de nombreux dispositifs médicaux extra et intra corporels (pansements, prothèses vasculaires, etc...). La recherche vise à leur apporter des propriétés thérapeutiques (antibactérienne, cicatrisante, régénérative). Parmi les solutions développées on peut transformer le dispositif en un réservoir libérant des substances actives. Le défi est de modifier le support chimiquement inerte selon des procédés non agressifs qui permettent l’incorporation de quantités suffisantes de la molécule active pour constituer une dose thérapeutique efficace dont la libération couvrira la période de cicatrisation. Le travail présenté dans cette thèse décrit une évolution du concept précédemment élaboré par le Laboratoire UMET, basé sur le greffage de cyclodextrines sur des biomatériaux variés pour la libération prolongée de médicaments. Il s’agit de l’application de la technique layer-by-layer (LbL) consistant à élaborer un assemblage multicouche - sur un support textile (PET) par superposition alternée de deux polyélectrolytes de charges opposes, pour former un enrobage des fibres par un film multicouche qui permettra au dispositif libérer un principe actif de manière prolongée. Notre système multicouche est basé sur un polymère anionique de β-cyclodextrine, alternant avec le chitosan (polymère cationique). L’optimisation de la construction LbL du film multicouche a été étudiée en parallèle par spectroscopie optique par guide d’onde (OWLS) et sur le textile ; sa dégradation et la libération de molécules modèles de principes actifs ont été suivies dans différents milieux, et les propriétés biologiques et microbiologiques ont été étudiées. / Textiles are widely used in medical devices which are implantable or not (wound dressing, vascular prosthesis etc…) and researches currently aim to bring them therapeutic properties (antibacterial, healing, regenerative). Among the most efficient solutions, transforming the device into a drug delivery system capable of releasing some drugs or bioactive substances is investigated. The main challenges are firstly to chemically modify such inert materials with soft methods in order to keep their original properties, and secondly to adsorb a sufficient therapeutic dose of the drug that should then be released covering the critical healing period. The concept developed by the UMET laboratory consists of grafting cyclodextrins on several biomaterials for extended drug release. This work presents an evolution of this latter concept thanks to the Layer-by-Layer process. Multilayer assemblies are built on a textile support thanks to alternative adsorptions of polyelectrolytes with opposite charges. It forms a multilayer coating on the fibers which allows the extended release of active molecules. Our multilayer system is based on an anionic polymer of β-cyclodextrin and chitosan (cationic polymer). Multilayer building optimization following the LbL process was simultaneously studied with Optical Waveguide Lightmode Spectroscopy (OWLS) and on textile. Its degradation and release of actives model molecules were followed in different media and biological and microbiological properties were studied.
297

La douleur du dévoilement

Merola, Chloé January 2016 (has links) (PDF)
Ce mémoire qui accompagne mon projet de fin de maîtrise, suit également tout mon processus créatif depuis le début de ma recherche en arts. Mon travail partait d'une intention maladroite et introspective, que j’assimilais à une sorte de thérapie : essayer de déjouer les mécanismes de l’inconscient pour guérir le mal-être que j'éprouve et trouver un équilibre dans ma vie actuelle. Je pars de souvenirs intimes et les sublime afin de mettre en forme mon travail artistique et d'exorciser, d'expier ma douleur et ma mémoire. A travers cette recherche personnelle et autoréférentielle, j'ai su trouver d'autres intérêts explorés tout au long de mes écrits : des questionnements sur la présence de l'intimité et du personnage dans la performance, l'importance du champ émotionnel et la façon dont l'abstraction des émotions peut être matérialisée, le statut de l'artiste contemporain et de l’oeuvre d'art actuelle ainsi que l'importance du partage du résultat de mon cheminement avec le spectateur dans une relation empathique. Au cours de ma recherche, j'ai également pointé le terme d'installaCtion et la relation particulière qu’elle permet d’instaurer avec le spectateur, témoin du l’histoire que je raconte. Je cherche à l'impliquer émotionnellement et parfois physiquement dans l'installaCtion, qui ne fonctionnerait pas sans sa présence. La structure de mon mémoire repose sur l’instauration de mon losange émotionnel : ce blason aux contours rouges témoigne de ma vie intérieure et relie le cerveau, le coeur, les poumons et le système digestif. Cette classification de mon flux d'émotions me permet de mieux comprendre mon processus créatif et de l'analyser par un jeu d'association de notions et d'idées en relations avec ma vie organique. Le losange est aussi le reflet de la somatisation, la douleur psychique transposée en douleur physique, une thématique qui me touche car elle entretient des mécaniques énigmatiques en relation avec le cerveau et le souvenir. Le titre de mon mémoire, La douleur du dévoilement, relate de la difficulté de mener à bien une recherche éprouvante pour l'implication personnelle et émotionnelle qu'elle demande et de mon rapport intime et particulier avec le public.
298

Processus de mise en place et évolution des systèmes de volcans de boue / Occurrence and growth of mud volcano systems

Dupuis, Matthieu 27 June 2017 (has links)
Cette thèse porte sur les mécanismes responsables de la croissance de systèmes de volcans de boue ainsi que sur les processus qui gouvernent leur évolution de surface. L’étude s’appuie sur une analyse structurale sur données sismiques faite sur deux structures anticlinales localisées dans le NW du Bassin Sud Caspien ainsi que sur une analyse structurale de terrain approfondie couplée à une imagerie de la sub-surface des édifices par résistivité électrique ainsi que par études géochimiques d’édifices volcaniques localisés dans la continuité onshore du bassin de la Kura en Azerbaïdjan. Les volcans à morphologie de mud pie montrent une morphologie plate car leur croissance est régie par la présence d’une réserve de matériel argileux non induré en surface que l’on appelle chambre superficielle. L’arrivée de matériel depuis une source de boue peu profonde induit le gonflement de cette chambre qui, en se rééquilibrant, provoque des déformations de surface et un élargissement de l’objet selon un modèle de Pousse-Muraille. Les édifices à morphologie coniques sont liés à des zones de stockage de matériel argileux plus profondes (chambre secondaire) voire à la source de boue, la zone de fluidisation du sédiment (chambre primaire). La source de fluides (eau et gaz) et nettement démarquée de la source de boue. La sédimentation est un facteur clé dans l’évolution des systèmes de volcan de boue car elle permet de sceller les chemins de migration de fluides, relançant la formation de surpression de fluide, créant une évolution par épisodes successifs de systèmes de volcans de boue emboîtés : les complexes de systèmes de volcan de boue. / This doctoral work studies the mechanisms involved in the growth of mud volcanoes systems and the processes involved with their surface evolution. The study is based on a structural analysis using seismic data acquired on two anticlines located in the NW of the South Caspian Basin and on an extensive structural field work combined with a sub-surface imagery based on electrical resistivity and geochemical analysis on edifices located on the onshore in continuity of the Kura Basin (Azerbaijan). Mud Pie are edifices having a flat morphology induced by the occurrence of a reserve of liquid mud on surface that we call Superficial Chamber. The input of material from a shallow mud source induce the inflation of this chamber which, reaching the equilibrium, induces a compressional stress that deform the edifice and make it grow, following a model named “Pushing Walls”. Conical edifices are linked to deeper storage zones (Secondary Chamber) or even to the source of mud itself (Primary Chamber). The fluid source (water and gas) is clearly disconnected to the source of mud. Sedimentation plays a dominant role on mud volcano systems evolution allowing to seal the fluid migration paths, thus the formation of fluids overpressure, inducing an evolution by successive pulses leading to interlocked mud volcano systems: mud volcano systems complexes.
299

Modélisation par champ de phase et atomique des interfaces hétérophases : application aux hydrures de zirconium / Phase-Field and atomic modelling of heterophase interfaces : application to zirconium hydrides

Louchez, Marc-Antoine 20 June 2017 (has links)
Le but de ce travail était de contribuer à une meilleure compréhension des mécanismes complexes qui sous-tendent la formation et l’évolution des hydrures dans le zirconium α et ses alliages. Dans ce contexte, des approches multi-échelles, mêlant simulations atomiques et par champ de phase, ont été employées pour aborder les propriétés structurales et énergétiques des interfaces hétérophases α|hydrures. Un intérêt particulier a été porté à l'hydrure γ-ZrH, en raison de sa stabilité et ses relations avec les chemins de précipitation controversés, via l’étude des interfaces basales et prismatiques complétée par une étude soignée des plans d’habitat. Une méthodologie originale transposable à d’autres systèmes, fondée sur la théorie microélastique combinée à des calculs ab initio, a été proposée pour estimer les énergies relatives à ces interfaces. Les résultats montrent une forte anisotropie jusque-là négligée dans la littérature. Du fait du caractère semi-cohérent des interfaces prismatiques, une évaluation correcte de leur énergie s'est révélée difficile. Une approche alternative a donc été suggérée, fondée sur un formalisme de champ de phase à même de décrire la structure de cœur des dislocations inhérentes à des interfaces prismatiques hc|cfc. Elle s’est avérée utile pour estimer la stabilité interfaciale de divers systèmes et pour prédire la perte de cohérence d’un germe croissant. Il a été montré que l'hydrure ζ-Zr2H cohérent constituerait un bon précurseur de γ. Enfin, l'emploi de la théorie microélastique aux interfaces α|hydrures a clairement indiqué la préférence pour des plans d'habitat pyramidaux πI. Un effet notable de la teneur en hydrogène a aussi été observé. / The goal of this work was to contribute to a better understanding of the complex mechanisms underpinning the formation and evolution of hydrides in α zirconium and its alloys. In this context, multi-scale approaches combining atomic and phase-field simulations were employed to address the structural and energetic properties of heterophase α|hydrides interfaces. A peculiar attention was focused on the γ-ZrH hydride due to its controversed stability and to its supposed role one many sequences of precipitation. In particular, the study was concentrated on the basal and prismatic interfaces complemented by a meticulous study of the habit planes. An original methodology, transferable to other systems and based on the microelasticity theory combined with ab initio calculations, was proposed to estimate the energies related to these interfaces. The results show a strong anisotropy hitherto neglected in the literature. Due to the semi-coherent nature of prismatic interfaces, a correct evaluation of its energy was proven to be difficult. Thus, an alternative approach, grounded in a phase-field formalism and able to describe the core structure of inherent dislocations in prismatic interfaces, has been suggested. This approach turned out useful to estimate the interfacial stability of various systems as well as to predict the coherency loss of a growing seed. It has been showed that the coherent ζ-Zr2H hydride could constitute a good precursor of γ-hydride. Finally, the application of the microelasticity theory to α|hydrides interfaces has clearly showed a preference for πI pyramidal habit planes where a significant effect of hydrogen content in the hydride has also been observed.
300

Algorithmes budgétisés d'itérations sur les politiques obtenues par classification / Budgeted classification-based policy iteration

Gabillon, Victor 12 June 2014 (has links)
Cette thèse étudie une classe d'algorithmes d'apprentissage par renforcement (RL), appelée « itération sur les politiques obtenues par classification » (CBPI). Contrairement aux méthodes standards de RL, CBPI n'utilise pas de représentation explicite de la fonction valeur. CBPI réalise des déroulés (des trajectoires) et estime la fonction action-valeur de la politique courante pour un nombre limité d'états et d'actions. En utilisant un ensemble d'apprentissage construit à partir de ces estimations, la politique gloutonne est apprise comme le produit d'un classificateur. La politique ainsi produite à chaque itération de l'algorithme, n'est plus définie par une fonction valeur (approximée), mais par un classificateur. Dans cette thèse, nous proposons de nouveaux algorithmes qui améliorent les performances des méthodes CBPI existantes, spécialement lorsque le nombre d’interactions avec l’environnement est limité. Nos améliorations se portent sur les deux limitations de CBPI suivantes : 1) les déroulés utilisés pour estimer les fonctions action-valeur doivent être tronqués et leur nombre est limité, créant un compromis entre le biais et la variance dans ces estimations, et 2) les déroulés sont répartis de manière uniforme entre les états déroulés et les actions disponibles, alors qu'une stratégie plus évoluée pourrait garantir un ensemble d'apprentissage plus précis. Nous proposons des algorithmes CBPI qui répondent à ces limitations, respectivement : 1) en utilisant une approximation de la fonction valeur pour améliorer la précision (en équilibrant biais et variance) des estimations, et 2) en échantillonnant de manière adaptative les déroulés parmi les paires d'état-action. / This dissertation is motivated by the study of a class of reinforcement learning (RL) algorithms, called classification-based policy iteration (CBPI). Contrary to the standard RL methods, CBPI do not use an explicit representation for value function. Instead, they use rollouts and estimate the action-value function of the current policy at a collection of states. Using a training set built from these rollout estimates, the greedy policy is learned as the output of a classifier. Thus, the policy generated at each iteration of the algorithm, is no longer defined by a (approximated) value function, but instead by a classifier. In this thesis, we propose new algorithms that improve the performance of the existing CBPI methods, especially when they have a fixed budget of interaction with the environment. Our improvements are based on the following two shortcomings of the existing CBPI algorithms: 1) The rollouts that are used to estimate the action-value functions should be truncated and their number is limited, and thus, we have to deal with bias-variance tradeoff in estimating the rollouts, and 2) The rollouts are allocated uniformly over the states in the rollout set and the available actions, while a smarter allocation strategy could guarantee a more accurate training set for the classifier. We propose CBPI algorithms that address these issues, respectively, by: 1) the use of a value function approximation to improve the accuracy (balancing the bias and variance) of the rollout estimates, and 2) adaptively sampling the rollouts over the state-action pairs.

Page generated in 0.0469 seconds