• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 340
  • 4
  • 3
  • 1
  • Tagged with
  • 348
  • 197
  • 67
  • 57
  • 53
  • 51
  • 48
  • 47
  • 46
  • 43
  • 43
  • 41
  • 39
  • 37
  • 36
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
301

Caracterização mecânica e análise de falha de juntas termoplásticas soldadas e termorrígidas coladas de laminados compósitos de grau aeronáutico / Mechanical characterization and failure analysis of thermoplastic welded and thermosetting bonded single-lap joints of aeronautical composite laminates

Carlos Eduardo Gomes de Castro 23 February 2015 (has links)
Este trabalho objetivou a caracterização mecânica e a análise de falha de dois tipos de juntas compósitas através de ensaios mecânicos, em que uma das juntas era composta por dois laminados de fibras de carbono recoberto em ambas as faces por tecido de fibra de vidro reforçando uma matriz termoplástica (PPS-C) unidos via soldagem por resistência elétrica, e a outra confeccionada com dois laminados de fibras de carbono reforçando uma matriz de resina epóxi (EPX-C) unidos via colagem por filme de resina epoxídica. Os dois tipos de juntas foram submetidos a impacto único transversal de 10 J, condicionamento higrotérmico, além de carregamento em fadiga compressiva no plano nas mais diversas combinações destes processos degradativos de suas propriedades mecânicas. Observou-se, que a junta termorrígida colada de EPX-C apresentou a maior resistência mecânica em flexão em quatro pontos (F4P) na condição original (como-manufaturada), assim como os maiores valores de resistência residual para as várias condições de degradação mecânica e higrotérmica a que foi submetida. Por sua vez, a junta termoplástica soldada de PPS-C exibiu, em termos percentuais, menores reduções dos valores de resistência à flexão sob as condições avaliadas, relativamente às perdas apresentadas pela junta EPX-C em idênticas circunstâncias. A análise macroscópica da superfície de fratura de ambas as juntas indicou que o modo de falha predominante da junta termorrígida foi interfacial enquanto que, para a junta PPS-C, o modo de falha predominante foi o intralaminar. Análises fratográficas através da microscopia eletrônica de varredura (MEV) evidenciaram para a junta termorrígida EPX-C, uma alta adesão entre fibra/matriz, porém uma relativamente fraca interação entre os aderentes (laminado) e o filme adesivo de colagem, enquanto que, para a junta termoplástica PPS-C, reduzidas interações fibra/matriz forem inferidas na camada externa de PPS-V do aderente assim como entre a malha metálica resistiva e os filmes puros de PPS que a revestiam. Em ensaios de resistência ao cisalhamento interlaminar (ILSS), os espécimes retirados da junta EPX-C na condição virgem evidenciaram uma colagem uniforme/homogênea, enquanto que, para a junta PPS-C, os espécimes de ensaio usinados a partir da junta virgem indicaram a ocorrência de efeitos de degradação térmica altamente localizada nas bordas soldadas. / This study aimed to mechanical characterization and failure analysis of two kinds of composite single-lap joints by mechanical tests, in which a single-lap joint was made of two adherents of carbon fibers coated on both sides with glass fiber fabric reinforcing a thermoplastic matrix (PPS-C) welded via resistance welding, and the another type made of two adherents of carbon fibers reinforcing an epoxy matrix (EPX-C) bonded by epoxy adhesive film. The two types of single-lap joints were subjected to single transverse impact of 10 J, hygrothermal conditioning, and compressive fatigue loading in the plane in various combinations of these degradative processes of mechanical properties. It was observed that the thermosetting bonded joint EPX-C showed the highest strength in four point-flexure test in the original condition (as-manufactured), as well as greater residual strength values for the various conditions of mechanical and hygrothermal degradation which was subjected. In turn, the welded thermoplastic joint PPS-C exhibited, in percentage terms, smaller reductions in flexural strength values under the tested conditions, in respect of losses showed by EPX-C in similar circumstances. Macroscopic analysis of the fracture surfaces from both joints indicated that the predominant failure mode was interfacial to thermosetting while for PPS-C joint, the predominant failure mode was intralaminar. Analysis of fracture surfaces by scanning electron microscopy (SEM) showed, for thermosetting joints EPX-C, a high adhesion between fiber/matrix, but a relatively weak interaction between adherents and the bonding adhesive film, whereas for thermoplastic joint PPS-C, reduced interactions fiber/matrix are inferred in the outer layers of PPS-V and between metal mesh and the pure PPS films that coated it. In the interlaminar shear strength tests (ILSS), the specimens removed from the EPX-C joint in the pristine condition showed a uniform/homogeneous bonding along the joint area, while for PPS-C joint, coupons extracted from pristine condition joint indicated the occurrence of degradation caused by thermal effects localized in the welded edges.
302

Caracterização da sílica amorfa extraída da casca de arroz obtida por pré-hidrólise ácida e calcinação, e sua aplicação em borracha de estireno-butadieno (SBR) / Characterization of amorphous rice husk silica obtained by acidic prehydrolysis and calcination, and its application in styrene-butadiene rubber (SBR)

Eduardo Roque Budemberg 14 June 2013 (has links)
O crescimento dos países em desenvolvimento aumentará em várias vezes o consumo de energia, materiais e alimentos. Para suprir essa demanda é necessário o aproveitamento racional dos resíduos gerados por processos industriais, agrícolas e lixo urbano, transformando-os em energia economicamente competitiva com as outras formas de energia, e em materiais com propriedades otimizadas. O objetivo do presente trabalho foi comparar o comportamento da sílica da casca de arroz obtida por pré-hidrólise ácida seguida de calcinação controlada (Sil-PH) com sílicas de casca de arroz comerciais obtidas simplesmente pela queima da casca (Sil-B e Sil-C) e com a sílica comercial obtida da areia quartzítica (Sil-Z), como carga de reforço em borracha de estireno-butadieno (SBR), que é a mais usada na indústria de fabricação de pneus. Estudos foram conduzidos em SBR 1502, preparados conforme norma ASTM 3191-2010. Foram adicionadas à borracha as sílicas em concentrações de 0, 10, 20 e 40 ppcb. Foram conduzidos testes físicos, químicos, mecânicos, reométricos, dinâmico-mecânicos e análise térmica, bem como ensaios de inchamento dos corpos de prova em toluol e análise microestrutural das sílicas e dos compostos por microscopia eletrônica de varredura, com o objetivo de determinar a natureza do reforço. O número de ligações cruzadas foi avaliado e a energia de formação dessas ligações foi calculada. A relação entre as metodologias de cálculo da densidade de ligações cruzadas foi também avaliada, obtendo a caracterização desse tipo de carga de reforço não somente por correlações mecânicas mas também pela energia de formação das ligações. Os resultados mostraram que quanto maior a adição de sílica, maior é sua interação com a borracha. Dentre as sílicas adicionadas, Sil-Z alcançou os maiores valores de propriedades mecânicas dos compostos, e Sil-PH mostrou os melhores resultados dentre as sílicas de casca de arroz. Por avaliação por inchamento em toluol (teste estático) e por testes de tração e testes dinâmicos foi possível afirmar que as densidades de ligações cruzadas estão correlacionadas, Usando os resultados de reometria e as equações de Arrhenius estimou-se uma energia média de ligação, concluindo que esta corresponde a uma ligação do tipo covalente. Pelos valores de tan ? confirmou-se que os compostos com Sil-PH têm maior aderência no chão molhado do que aqueles com Sil-Z. A sílica nos compostos tende a diminuir a temperatura de transição vítrea. Os resultados da análise térmica mostraram elevada estabilidade térmica dos compostos com Sil-PH e Sil-Z. A falta de cominuição adequada da Sil-PH ocasionou uma dispersão irregular da sílica na SBR, uma molhabilidade parcial da sílica pela borracha e pelo agente de acoplamento, com consequente aparecimento de falhas na estrutura do composto. Por esse motivo as propriedades mecânicas dos compostos com Sil-PH foram inferiores às dos compostos com Sil-Z. / Developing countries are increasing by several times their consumption of energy, materials, and food. To attend their demand it is necessary to rationally reuse industrial, agricultural, and municipal solid waste residues, transforming them into economically competitive energy and materials with optimized properties. The objective of this work was to compare the behavior of a rice husk silica obtained by acidic prehydrolysis and controlled calcination (Sil-PH) with commercial amorphous silicas obtained from quartzite sand (Sil-Z) and from simply burned rice husks (Sil-B and Sil-C), as reinforcing filler in styrene-butadiene rubber (SBR) composites, which is the most used rubber in the tire manufacture industry. Studies were conducted on SBR 1502 rubber according to ASTM 3191-2010 in which amorphous silicas obtained from rice husk and quartzite silica were added at concentrations of 0, 10, 20, and 40 phr. Physical, chemical, mechanical, rheometric, dynamic-mechanical tests, thermal analysis, swelling studies in toluol and scanning electron microscopy of the silicas and composite specimens were made with objective to determine the nature of reinforcement. The number of crosslinks was evaluated and the energy of formation of these bonds calculated. The correlation between the methodologies of calculation of crosslink density was also evaluated, getting the characterization of this type of reinforcing filler not only by mechanical correlations but also by the energy of their formation. The results showed that the higher the content of added silica, the greater the interaction with rubber. According to the mechanical properties values Sil-Z achieved the highest properties values but Sil-PH showed better results compared to the other types of rice husk silicas. By evaluation by swelling in toluene (static), tensile tests and dynamic tests it was possible to affirm that the crosslink densities are correlated. By using the rheometry results and the Arrhenius equations the average bound was estimated to be of a covalent type. The silica in the compounds tends to lower the values of the glass transition temperature. The evaluation of tan ? showed that Sil-PH has more stickiness on the wet floor, which is an important property to tire application. Due to the lack of appropriate grinding of the Sil-PH the dispersion of the silica on SBR was irregular; partial wetting of the silica particles by rubber and silane had also occurred. Those facts had caused failures on the compound structural integrity, with a consequent lowering of the mechanical property values as compared to the compounds with Sil-Z addition.
303

Influência da inserção de fibras de Al2O3/GdAlO3 na resistência mecânica de monolayers e bilayers de cerâmicas odontológicas / Flexural strength of ceramic monolayers and bilayers bars reinforced by Al2O3/GdAlO3 fibers

Ricardo Sgura 20 May 2010 (has links)
O presente estudo avaliou a adição de fibras cerâmicas de 0,5mm de diâmetro de Al2O3/GdAlO3 obtidas por fusão a laser (método LHPG - laser heated pedestal growth) em porcelanas de cobertura dos sistemas In Ceram Alumina, In-Ceram 2000 Al Cubes e In-Ceram 2000 YZ Cubes para CEREC (VITA Zahnfabrik). Barras confeccionadas apenas com a porcelana de cobertura (VM7 ou VM9 - monolayers) ou constituídas por ambas a cerâmica da infraestrutura e porcelana de cobertura (bilayers) receberam as fibras dispostas longitudinalmente nas proporções de 10 ou 17% vol. Barras que não receberam fibras serviram como controle dos grupos. Os corpos-de-prova (CP) com fibras assim como os do grupo controle foram submetidos a um teste de flexão em três pontos. Foram calculadas as médias para a densidade e resistência à flexão dos CP, assim como para as fibras isoladamente. A tenacidade à fratura das fibras também foi mensurada. Em todos os casos a análise de variância de um fator e o teste de Tukey com 5% de significância foram aplicados. Microscopia eletrônica de varredura foi utilizada para caracterização microestrutural das fibras e para estudo fractográfico. Foram realizadas análises de difratometria por raio-x dos materiais cerâmicos nos estados pré e pós-sinterização, assim como foram determinados os coeficientes de expansão térmico-linear das porcelanas de cobertura por dilatometria. Os CP monolayers da porcelana VM9 contendo fibras apresentaram, após a sinterização, trincas e falhas, o que impediu a continuidade dos testes com os grupos de cerâmicas do sistema In-Ceram 2000 YZ Cubes. Os CP com fibras adicionadas à porcelana VM7 em 17% vol. apresentaram resistência à flexão aumentada em 43% comparados aos CP do grupo controle, sem fibras. Nos grupos bilayers as fibras propiciaram aumento apenas numérico da resistência à flexão do conjunto, porém de forma não significante. / This study evaluated the addition of 0.5mm of diameter Al2O3/GdAlO3 fibers obtained by LHPG (Laser Heated Pedestal Growth) to veneering porcelains of the following materials: porcelain monolayers: VM7 and VM9; Bilayers: In-Ceram Alumina + VM7, In-Ceram 2000 AL Cubes + VM7 and In-Ceram 2000 YZ Cubes for CEREC + VM9 (VITA Zahnfabrik). The specimens (bars) were composed by only the veneer porcelain (monolayer) or both the veneer and the framework (bilayer). The new ceramic composites contained longitudinal fibers in 10 or 17% vol. Specimens without fibers were used as control. A metallic device was developed for the standardization of the fibers position inside the specimens. The means of the fracture toughness, density and flexural strength of the developed fibers were calculated as well as the density and flexural strength of the composites. One way ANOVA and a Tukey test (5%) were applied. Characterizations of fiber/porcelain interface and fractographyc analysis were carried out after scanning electronic microscopy (SEM) of bars. X-ray difratometry and dilatometry were also performed. Vm9 porcelain showed incompatibility with the fibers, probably due to differences between the coefficients of thermal expansion of fibers and porcelain. VM7 monolayers with the addition of 17% of fibers in volume showed significantly higher resistance in relation to control. It was concluded that the inclusion of ceramic fibers of Al2O3/GdAlO3 to veneer porcelain improves its flexural strength.
304

Agente topológico de aprendizado por reforço / Topological reinforcement learning agent

Arthur Plínio de Souza Braga 07 April 2004 (has links)
Os métodos de Aprendizagem por Reforço (AR) se mostram adequados para problemas de tomadas de decisões em diversos domínios por sua estrutura flexível e adaptável. Apesar de promissores, os métodos AR frequentemente tem seu campo de atuação prático restrito a problemas com espaço de estados de pequeno ou médio porte devido em muito à forma com que realizam a estimativa da função de avaliação. Nesta tese, uma nova abordagem de AR, denominada de Agente Topológico de Aprendizagem por Reforço (ATAR), inspirada em aprendizagem latente, é proposta para acelerar a aprendizagem por reforço através de um mecanismo alternativo de seleção dos pares estado-ação para atualização da estimativa da função de avaliação. A aprendizagem latente refere-se à aprendizagem animal que ocorre na ausência de reforço e que não é aparente até que um sinal de reforço seja percebido pelo agente. Este aprendizado faz com que um agente aprenda parcialmente uma tarefa mesmo antes que este receba qualquer sinal de reforço. Mapas Cognitivos são usualmente empregados para codificar a informação do ambiente em que o agente está imerso. Desta forma, o ATAR usa um mapa topológico, baseado em Mapas Auto-Organizáveis, para realizar as funções do mapa cognitivo e permitir um mecanismo simples de propagação das atualizações. O ATAR foi testado, em simulação, para planejamento de navegação de um robô móvel em ambientes inicialmente desconhecidos e não-estruturados. Comparações com outros seis algoritmos AR avaliaram comparativamente o desempenho do agente proposto na navegação. Os resultados obtidos são promissores e comparáveis com os algoritmos AR mais rápidos testados, alcançando em alguns ensaios desempenho superior aos dos demais algoritmos - principalmente nas simulações que consideram situações observadas em ambientes não-estruturados. Três características do ATAR original foram alteradas para tornar ainda mais viável sua aplicação prática: (i) mudanças no mapa topológico para reduzir o número de vértices, (ii) mudança na heurística usada na seleção das ações do agente e (iii) variações na estratégia de exploração do ATAR. Do ponto (i), foi proposto e implementado um novo mapa topológico, o Mapa Topológico Incremental Classificador MTIC, que a partir da classificação dos estados do ambiente gera os vértices de uma triangularização de Watson. O ponto (ii) criou um método aplicável a outros problemas de planejamento de trajetória em grafos denominado de Melhoria das trajetórias por detecção de ponto interior. O terceiro estudou estratégias direcionadas de exploração como uma opção para acelerar o aprendizado do ATAR. / Reinforcement Learning (RL) methods have shown to be a good choice for decision-making problems due to their flexible and adaptive characteristics. Despite such promising features, RL methods often have their practical application restricted to small or medium size (at state, or state-action, space) problems mainly because of their standard strategies for value function estimation. In this thesis, a new RL approach, called \"Topological Reinforcement Learning Agent\" - TRLA, is proposed to accelerate learning through an alternative mechanism to update the state-action value function. TRLA is inspired in latent learning, which refers to animal learning that occurs in the absence of reinforcements and that is not visible until an environmental reinforcement is perceived. This concept considers that part of a task can be learned even before the agent receives any indication of how to perform such a task. Cognitive Maps are usually used to encode information about the environment where the agent is immersed. Thus, the TRLA uses a topological map, based on Self-Organized Maps, to implement cognitive map functions and permit a new simple mechanism to execute the propagation of state-action updates. The chosen problem to test TRLA is the simulation of a mobile robot navigation in some initially unknown and unstructured environments. Performance comparisons of the TRLA with six other RL algorithms were carried out to the execution of the navigation task. The obtained results are very promising and comparable with some of faster RL algorithms simulated. In some experiments, the TRLA\'s performance overcomes the others especially in simulations with unstructured environments. Three characteristics of the original TRLA were modified to make it more suitable for real implementations: (i) changes in the topological map construction to reduce the vertices number, (ii) changes in the agents heuristic for action selection, and (iii) variations on the TRLAs strategy for exploration of the state-action space. In (i), a new procedure to construct topological maps was proposed and implemented, the Incremental Classifier Topological Map ICTM, which generates the vertices for a Watsons triangulation from the classification of the input states. In (ii), it was proposed a method to optimize trajectory planning problems based on graphs, denoted \"trajectory improvement from inner point detection\". The third point considers directed exploration strategies as an option for TRLA\'s learning acceleration.
305

Arquitetura robótica inspirada na análise do comportamento / Robotic architecture inpired from Behavior analysis

Cláudio Adriano Policastro 24 October 2008 (has links)
Robôs sociáveis devem ser capazes de interagir, se comunicar, compreender e se relacionar com os seres humanos de uma forma natural. Existem diversas motivações práticas e científicas para o desenvolvimento de robôs sociáveis como plataforma de pesquisas, educação e entretenimento. Entretanto, embora diversos robôs sociáveis já tenham sido desenvolvidos com sucesso, ainda existe muito trabalho para aprimorar a sua eficácia. A utilização de uma arquitetura robótica pode reduzir fortemente o esforço requerido para o desenvolvimento de um robô sociável. Tal arquitetura robótica deve possuir estruturas e mecanismos para permitir a interação social, o controle do comportamento e o aprendizagem a partir do ambiente. Tal arquitetura deve ainda possuir estruturas e mecanismos para permitir a percepção e a atenção, a fim de permitir que um robô sociável perceba a riqueza do comportamento humano e do meio ambiente, e para aprender a partir de interações sociais. Os processos de aprendizado evidenciados na Análise do Comportamento podem levar ao desenvolvimento de métodos e estruturas promissoras para a construção de robôs sociáveis capazes de aprender por meio da interação com o meio ambiente e de exibir comportamento social apropriado. O proposito deste trabalho é o desenvolvimento de uma arquitetura robótica inspirada na Análise do Comportamento. A arquitetura desenvolvida é capaz de simular o aprendizado do comportamento operante e os métodos e estruturas propostos permitem o controlo e a exibição de comportamentos sociais apropriados e o aprendizado a partir da interação com o meio ambiente. A arquitetura proposta foi avaliada no contexto de um problema real não trivial: o aprendizado da atenção compartilhada. Os resultados obtidos mostram que a arquitetura é capaz de exibir comportamentos apropriados durante uma interação social real e controlada. Ainda, os resultados mostram também que a arquitetura pode aprender a partir de uma interação social. Este trabalho é a base para o desenvolvimento de uma ferramenta para a construção dos robôs sociáveis. Os resultados obtidos abrem muitas oportunidades de trabalhos futuros / Sociable robots should be able to interact, to communicate, to understand and to relate with human beings in a natural way. There are several scientific and practical motivations for developing sociable robots as platform of researches, education and entertainment. However, although several sociable robots have already been developed with success, much work remains to increase their effectiveness. The use of a robotic architecture may strongly reduce the time and effort required to construct a sociable robot. Such robotic architecture must have structures and mechanisms to allow social interaction, behavior control and learning from environment. Such architecture must also have structures and mechanisms to allow perception and attention, to enable a sociable robot to perceive the richness of the human behavior and of the environment, and to learn from social interactions. Learning processes evidenced on Behavior Analysis can led to the development of promising methods and structures for the construction social robots that are able to learn through interaction from the environment and to exhibit appropriate social behavior. The purpose of this work is the development of a robotic architecture inspired from Behavior Analysis. The developed architecture is able to simulate operant behavior learning and the proposed methods and structures allow the control and exhibition of appropriate social behavior and learning from interaction in the environment. The proposed architecture was evaluated in the context of a non trivial real problem: the learning of the shared attention. The obtained results show that the architecture is able to exhibit appropriate behaviors during a real and controlled social interaction. Additionally, the results show also that the architecture can learn from a social interaction. This work is the basis for developing a tool for the construction of social robots. The obtained results open oportunities of many future works
306

Arquitetura híbrida inteligente para navegação autônoma de robôs / Intelligent hybrid architecture for robot autonomous navigation

Rodrigo Calvo 09 March 2007 (has links)
Este projeto consiste em um sistema de navegação autônomo baseado em redes neurais nebulosas modulares capacitando o robô a alcançar alvos, ou pontos metas, em ambientes desconhecidos. Inicialmente, o sistema não tem habilidade para a navegação, após uma fase de experimentos com algumas colisões, o mecanismo de navegação aprimora-se guiando o robô ao alvo de forma eficiente. Uma arquitetura híbrida inteligente é apresentada para este sistema de navegação, baseada em redes neurais artificiais e lógica nebulosa. A arquitetura é hierárquica e costitiui-se de dois módulos responsáveis por gerar comportamentos inatos de desvio de obstáculos e de busca ao alvo. Um mecanismo de aprendizagem por reforço, baseada em uma extensão da lei de Hebb, pondera os comportamentos inatos conflitantes ajustando os pesos sinápticos das redes neurais nos instantes de captura do alvo e de colisão contra obstáculos. A abordagem consolidada em simulação é validada em ambientes reais neste trabalho. Para tanto, este sistema foi implementado e testado no simulador Saphira, ambiente de simulação que acompanha o robô Pioneer I e que denota um estágio anterior aos testes em ambientes reais por apresentar comportamentos do robô similares aos comportamentos do robô móvel. Modificações na arquitetura híbrida foram necessárias para adaptar o sistema de navegação simulado ao sistema incorporado no Pioneer I. Experimentos em ambientes reais demonstraram a eficiência e a capacidade de aprendizagem do sistema de navegação, validando a arquitetura híbrida inteligente para aplicação em robôs móveis / This project consists in a autonomous navigation system based on modular neuro-fuzzy networks that is able to guide the robot in unknown environments from a initial point to the goal. Initially, the system is not able to navigate, but after a trial and error period and some collisions, it improves in guiding the robot to the goal efficiently. A intelligent hybrid architecture is presented for this naviga tion system based on artificial neural networks and fuzzy logic. This architecture is hierarquical and consists in two modules that generate innate behaviors, like obstacles avoiding and target reaching. A reinforcement learning mecanism, based on the extended Hebb law, balances this conflicting innate behaviors adjusting the neural network synaptic weights as obstacle and collision avoidance and target reaching takes place. In this project, the approach is consolidated in simulation and validated in real environments. To this end, this system has been implemented by using Saphira simulator and Pioneer I simulation environment. This simulated evironment is a previous stage of tests performed real time and presents simulated robot behaviors similar to real mobile robot behaviors. The hybrid architecture was modified to adapt the simulated navigation system into Pioneer I software. Experiments in a real environments show the efficiency and learning capabilities of the navigation system, validating the intelligent hybrid architecture for mobile robots applications
307

Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda / Batch reinforcement learning: a case study for the problem of decision making in sales processes

Dênis Antonio Lacerda 12 December 2013 (has links)
Planejamento Probabilístico estuda os problemas de tomada de decisão sequencial de um agente, em que as ações possuem efeitos probabilísticos, modelados como um processo de decisão markoviano (Markov Decision Process - MDP). Dadas a função de transição de estados probabilística e os valores de recompensa das ações, é possível determinar uma política de ações (i.e., um mapeamento entre estado do ambiente e ações do agente) que maximiza a recompensa esperada acumulada (ou minimiza o custo esperado acumulado) pela execução de uma sequência de ações. Nos casos em que o modelo MDP não é completamente conhecido, a melhor política deve ser aprendida através da interação do agente com o ambiente real. Este processo é chamado de aprendizado por reforço. Porém, nas aplicações em que não é permitido realizar experiências no ambiente real, por exemplo, operações de venda, é possível realizar o aprendizado por reforço sobre uma amostra de experiências passadas, processo chamado de aprendizado por reforço em lote (Batch Reinforcement Learning). Neste trabalho, estudamos técnicas de aprendizado por reforço em lote usando um histórico de interações passadas, armazenadas em um banco de dados de processos, e propomos algumas formas de melhorar os algoritmos existentes. Como um estudo de caso, aplicamos esta técnica no aprendizado de políticas para o processo de venda de impressoras de grande formato, cujo objetivo é a construção de um sistema de recomendação de ações para vendedores iniciantes. / Probabilistic planning studies the problems of sequential decision-making of an agent, in which actions have probabilistic effects, and can be modeled as a Markov decision process (MDP). Given the probabilities and reward values of each action, it is possible to determine an action policy (in other words, a mapping between the state of the environment and the agent\'s actions) that maximizes the expected reward accumulated by executing a sequence of actions. In cases where the MDP model is not completely known, the best policy needs to be learned through the interaction of the agent in the real environment. This process is called reinforcement learning. However, in applications where it is not allowed to perform experiments in the real environment, for example, sales process, it is possible to perform the reinforcement learning using a sample of past experiences. This process is called Batch Reinforcement Learning. In this work, we study techniques of batch reinforcement learning (BRL), in which learning is done using a history of past interactions, stored in a processes database. As a case study, we apply this technique for learning policies in the sales process for large format printers, whose goal is to build a action recommendation system for beginners sellers.
308

Um agente autônomo baseado em aprendizagem por reforço direcionado à meta / An autonomous agent based on goal-directed reinforcement learning

Braga, Arthur Plínio de Souza 16 December 1998 (has links)
Uma meta procurada em inteligência artificial (IA) é o desenvolvimento de mecanismos inteligentes capazes de cumprir com objetivos preestabelecidos, de forma totalmente independente, em ambientes dinâmicos e complexos. Uma recente vertente das pesquisas em IA, os agentes autônomos, vem conseguindo resultados cada vez mais promissores para o cumprimento desta meta. A motivação deste trabalho é a proposição e implementação de um agente que aprenda a executar tarefas, sem a interferência de um tutor, em um ambiente não estruturado. A tarefa prática proposta para testar o agente é a navegação de um robô móvel em ambientes com diferentes configurações, e cujas estruturas são inicialmente desconhecidas pelo agente. O paradigma de aprendizagem por reforço, através de variações dos métodos de diferença temporal, foi utilizado para implementar o agente descrito nesta pesquisa. O resultado final obtido foi um agente autônomo que utiliza um algoritmo simples para desempenhar propriedades como: aprendizagem a partir de tabula rasa, aprendizagem incremental, planejamento deliberativo, comportamento reativo, capacidade de melhoria do desempenho e habilidade para gerenciar múltiplos objetivos. O agente proposto também apresenta um desempenho promissor em ambientes cuja estrutura se altera com o tempo, porém diante de certas situações seus comportamentos em tais ambientes tendem a se tornar inconsistentes. / One of the current goals of research in Artificial Intelligence is the proposition of intelligent entities that are able to reach a particular target in a dynamic and complex environment without help of a tutor. This objective has been becoming reality through the propositions of the autonomous agents. Thus, the main motivation of this work is to propose and implement an autonomous agent that can match the mentioned goals. This agent, a mobile robot, has to navigate in environments which are initially unknown and may have different structures. The agent learns through one of the main reinforcement learning strategies: temporal difference. The proposed autonomous employs a simple learning mechanisms with the following features: learns incrementally from tabula rasa, executes deliberative and reactive planning, improves its performance through interactions with the environment, and manages multiple objectives. The agent presented promising results when moving in a dynamic environment. However, there are situations in which the agent do not follow this last property.
309

A relação entre o dizer e o fazer para o comportamento de escolha de marcas / Correspondence in consumer self-report to brand choice behavior

Jannarelli, Eveline Prado 28 June 2006 (has links)
Made available in DSpace on 2016-04-29T13:18:01Z (GMT). No. of bitstreams: 1 Eveline Prado Jannarelli.pdf: 1870552 bytes, checksum: 002acff87d29ee501537d77cc468fc71 (MD5) Previous issue date: 2006-06-28 / nenhum / A busca por um melhor entendimento das variáveis que determinam o comportamento do consumidor tem sido um tema amplamente estudado por diversas áreas de atuação. Dos profissionais de marketing, aos economistas e psicólogos, o comportamento de comprar, usar e descartar artigos, serviços, idéias ou experiências tem envolvido a todos, seja por aspectos científicos e metodológicos, seja no desenvolvimento de uma atividade de trabalho. Sob uma perspectiva Behavorista Radical, este estudo buscou investigar a relação entre o dizer e o fazer para o comportamento de escolha de marcas, concentrando-se na análise do sujeito único. Para tanto foram colocadas duas questões: (1) averiguar se o dizer do consumidor em relação à compra de produtos específicos com marcas específicas é condizente com o fazer deste mesmo consumidor ao emitir o comportamento de compra destes produtos e marcas específicas e (2) averiguar se é possível encontrar um padrão entre o dizer do consumidor sobre o comportamento de compra em determinadas categorias e o comportamento efetivo de compra, a partir dos conceitos de reforço utilitário e informativo para cada situação. Para tanto foram coletados os dados de compra de 07 participantes a partir dos tickets de compras emitidos pelos estabelecimentos, durante um período mínimo de 20 semanas, para as categorias de Detergente em pó, Detergente líquido e Biscoito Doce. Para coleta do relato de compra, foi aplicada uma entrevista com cada participante após um período mínimo de dois meses do início da coleta do ticket de compra. Posteriormente, os dados de compra coletados foram comparados com os seguintes relatos de compra: freqüência de compra, amplitude de marca comprada, perfil de compra por nível de reforço informativo e utilitário geral e ao longo do período da pesquisa, preferência por uma marca, conhecimento de marca e compra declarada e razões de compra dentro da categoria. Este estudo pretende indicar alguns caminhos para a condução de um entendimento mais amplo dessa relação para o comportamento de escolha de marcas. Os resultados obtidos mostraram que: (a) houve uma maior incidência de compras para marcas classificadas com nível de reforço informativo 3, (b) não podemos afirmar que houve maior incidência de uma única combinação de nível de reforço informativo e utilitário, pois o perfil de compra por nível de reforço utilitário variou por participante e por categoria (c) há uma maior coerência entre o relato e o comportamento de compra observado para as marcas classificadas com nível informativo 3, (d) uma grande amplitude de marcas compradas dificulta o relato de conhecimento e costume de compra, (e) uma freqüência de compra menos espaçada (semanal) remete a uma melhor descrição do comportamento de compra (f) o consumidor relata com mais precisão os atributos do produtos (reforço utilitário) das marcas classificadas com nível de reforço informativo 3 do que as de nível informativo 2 e 1 e (g) houve uma maior correspondência entre o relato de compra e a compra efetiva, em primeiro lugar, para a categoria de Detergente líquido, seguida pela categoria de Detergente em pó e por último, a categoria de Biscoito Doce
310

O efeito de diferentes durações de luz sobre a aquisição e manutenção da resposta de pressão à barra com atraso de reforço / The effects of different durations of light on the response acquisition and maintenance of lever press with delayed reinforcement

Panetta, Paulo André Barbosa 07 May 2007 (has links)
Made available in DSpace on 2016-04-29T13:18:02Z (GMT). No. of bitstreams: 1 Paulo A B Panetta.pdf: 2725022 bytes, checksum: 647e2f895cbc2bf81fd00346a8f0e9ab (MD5) Previous issue date: 2007-05-07 / Fifteen rats were randomized to one of the five following groups (with three rats in each group) to examine the effects of different durations of light ( delay signal ) upon the response acquisition and maintenance of lever press with delayed reinforcement, on the absence of shaping. Two phases construct the experiment, with fifteen experimental sessions and two sessions in extinction on each phase. For the rats randomized to Chain II Group, when Phase 1 was initiated, the duration of the light was initially the same of the delay, but was reduced gradually across phase until it was no longer present with the delay period. For rats randomized to Chain III Group, there was no delay signal initially, but its duration was increased across phase until it equalized the duration of the programmed delay (4 s). The duration of the delay signal was always the same of the delay for the rats employed on Chain I Group, while the was no delay signal for rats randomized to Tand Group. With the rats randomized to the Control Group there was no delay on reinforcement. Within subjects, response rates where higher as the duration of the delay signal increased, with the highest acceleration when its duration was minimal. Response rates where higher also to prior rates when the duration of the delay signal was reduced, with the highest acceleration when its duration was minimal. The findings are discussed in terms of the conditioned reinforcement of the delay signal by reduction the delay between its onset and the reinforcer / Quinze ratos foram distribuídos em cinco grupos com o objetivo de avaliar os efeitos de diferentes durações de luz, que eram apresentadas durante o período de atraso, sobre a aquisição e manutenção da resposta de pressão à barra com atraso de reforço, sem modelagem dessa resposta. O estudo foi dividido em duas fases com dezessete sessões cada (quinze sessões experimentais e duas em extinção). Na Fase 1, para os sujeitos do Grupo Encadeado III, a luz não estava presente nas sessões iniciais. Com o decorrer das sessões, a duração da luz foi aumentada gradualmente até que a sua duração cobrisse todo o período de atraso. Para os sujeitos do Grupo Encadeado II, duração da luz equivalia à totalidade do período de atraso nas sessões iniciais, sendo reduzida gradualmente a sua duração ao longo das sessões até não haver luz durante o período. Nas sessões dos sujeitos do Grupo Tandem não havia luz durante o período de atraso, enquanto nas sessões dos sujeitos do Grupo Encadeado I a duração luz sempre cobria a totalidade do período. Já nas sessões dos sujeitos do Grupo Controle não havia atraso de reforço. Decorrida a Fase 1, o período de atraso foi aumentado de 4 s para 8 s e iniciou-se a Fase 2, idêntica à anterior. Foi observada, em ambas as fases, um aumento na taxa de emissões e de reforços produzidos pelos sujeitos do Grupo Encadeado III na medida que a duração da luz era aumentada, com um aumento maior em ambas as fases quando a luz tinha sua duração mínima. Do mesmo modo, foi notado um pequeno aumento na taxa de emissões e de reforços produzidos pelos sujeitos do Grupo Encadeado II a partir da redução na duração da luz, com aumento maior quando a duração da luz era mínima. Os resultados do presente estudo foram discutidos a partir da noção de reforçador condicionado e da hipótese da redução do atraso proposta por Fantino (1969, 1977)

Page generated in 0.0454 seconds