• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 145
  • 6
  • 6
  • 6
  • 6
  • 6
  • 4
  • 4
  • 4
  • 4
  • 2
  • 1
  • Tagged with
  • 152
  • 152
  • 79
  • 69
  • 50
  • 46
  • 45
  • 38
  • 33
  • 32
  • 29
  • 26
  • 24
  • 24
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Uso de agentes inteligentes no controle simultâneo da largura e do reforço dos cordões de solda no processo GMAW-S / Intelligent agents for simultaneously control of width and height of weld beads of GMAW-S process

Pinto Lopera, Jesús Emilio 28 March 2016 (has links)
Tese (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2016-06-24T15:46:47Z No. of bitstreams: 1 2016_JesusEmilioPintoLopera.pdf: 8122014 bytes, checksum: 6c1b283b2f3589e735731930ecfec908 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2016-06-28T20:13:14Z (GMT) No. of bitstreams: 1 2016_JesusEmilioPintoLopera.pdf: 8122014 bytes, checksum: 6c1b283b2f3589e735731930ecfec908 (MD5) / Made available in DSpace on 2016-06-28T20:13:14Z (GMT). No. of bitstreams: 1 2016_JesusEmilioPintoLopera.pdf: 8122014 bytes, checksum: 6c1b283b2f3589e735731930ecfec908 (MD5) / O processo de soldagem GMAW é um dos mais utilizado na produção industrial, devido, entre outras características, a seu alto grau de automação e a vantagem de se poder utilizar em diversas configurações com a maioria dos metais e ligas comerciais existentes. No caso da geometria dos cordões de solda no processo GMAW, diferentes pesquisas têm sido encaminhadas ao controle dos parâmetros operacionais que garantam as características geométricas requeridas, entre as mais importantes, a largura, o reforço e a penetração. Atualmente, diferentes modelos baseados em modelamento empírico ou em inteligência artificial são utilizados para controlar um parâmetro geométrico à vez. Este trabalho propõe uma estratégia que, independente de modelos predefinidos do processo, permite controlar simultaneamente a largura e o reforço dos cordões de solda no processo de soldagem GMAW no modo de transferência metálica por curto-circuito (GMAW-S). O controlador proposto é baseado em agentes inteligentes focados diretamente nas medições de largura e reforço dos cordões de solda. O monitoramento dos parâmetros geométricos é realizado em tempo real utilizando uma única câmera e diferentes metodologias de processamento digital de imagens. A avaliação da estabilidade do processo é realizada em tempo real e emprega-se para sair das regiões de instabilidade nas quais possa incorrer o processo durante a etapa de controle. A metodologia de monitoramento é avaliada como satisfatória utilizando o teste “t” para diferentes combinações de parâmetros de entrada. O tempo de processamento de cada imagem não supera os 3 ms, considerando-se adequado visando etapas de controle com uma taxa de amostragem de 100 Hz. Os resultados experimentais mostram que a implementação da estratégia de controle proposta é viável e consegue atingir simultaneamente diferentes valores de referência de largura e reforço dos cordões de solda. _______________________________________________________________________________________________ ABSTRACT / The GMAW process is widely used in industry due to, among others, its easer automation and high productivity. In the case of weld bead geometry in GMAW processes, different researches have been conducted to control operating parameters and to ensure required geometrical characteristics, among the most important: the width, the height and the penetration. Currently, different models, based on empirical modeling or artificial intelligence methodologies, are used to control individual geometric parameters. This work proposes a strategy that, regardless of predefined models, can simultaneously control the width and the height of the weld beads in GMAW-S process. The proposed control system is based on intelligent agents focus on measurements of the weld bead width and height. The geometric parameters monitoring is performed in real time using a single camera and different methods of digital image processing. The evaluation of process stability is performed in real time and employed to avoid the regions of instability in which may incur this process during the control stage. The monitoring methodology is assessed as satisfactory using the “t” test for different combinations of input parameters. The time of the image processing does not exceed 3 ms for each image and is considered appropriate to control steps, which use a 100 Hz sampling rate. The experimental results show that the implementation of the proposed control strategy is feasible in systems control without predefined model, achieving different width and height reference bead values.
42

Um arcabouço computacional para estudo do setor bancário através de modelos baseados em agentes

Lima, Joaquim Ignacio Alves de Vasconcellos e 23 April 2014 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, 2014. / Submitted by Larissa Stefane Vieira Rodrigues (larissarodrigues@bce.unb.br) on 2014-11-05T11:39:25Z No. of bitstreams: 1 2014_JoaquimIgnacioAlvesDeVasconcellosELima.pdf: 2181754 bytes, checksum: c52997a2df38466fb15c7bc052cfe7d3 (MD5) / Approved for entry into archive by Tania Milca Carvalho Malheiros(tania@bce.unb.br) on 2014-11-05T11:53:30Z (GMT) No. of bitstreams: 1 2014_JoaquimIgnacioAlvesDeVasconcellosELima.pdf: 2181754 bytes, checksum: c52997a2df38466fb15c7bc052cfe7d3 (MD5) / Made available in DSpace on 2014-11-05T11:53:30Z (GMT). No. of bitstreams: 1 2014_JoaquimIgnacioAlvesDeVasconcellosELima.pdf: 2181754 bytes, checksum: c52997a2df38466fb15c7bc052cfe7d3 (MD5) / Este trabalho descreve a concepção e a construção de um arcabouço computacional para estudo do setor bancário através de modelos baseados em agentes. A estrutura do arcabouço baseia-se em uma versão iterada do modelo Diamond-Dybvig, com um número arbitrário de agentes de diferentes tipos, como instituições financeiras, firmas, depositantes e bancos centrais. Inspirado pelo paradigma de sistemas complexos adaptativos, o estudo focaliza a auto-organização e as propriedades emergentes decorrentes das interações entre agentes heterogêneos, dotados de racionalidade limitada, implementada usando a abordagem Experienced-Weighted Attraction. Por fim, apresentam-se exemplos demonstrando as capacidades do arcabouço, com aplicações envolvendo seguro de depósitos, emprestador de última instância, mercado interbancário com câmara de pagamentos, bancos grandes demais para quebrar, risco de crédito e requerimento de capital. ______________________________________________________________________________ ABSTRACT / This paper design and construct a computational framework for the study of the banking sector through agent-based models. The structure of the framework is based on an iterated version of the Diamond-Dybvig model with an arbitrary number of agents of different types, such as financial institutions, firms, central banks and depositors. Inspired by the paradigm of complex adaptive systems, this study focuses on the self-organization and emergent properties arising from the interactions between heterogeneous agents, who are endowed with bounded rationality, implemented using the Experienced-Weighted Attraction approach. Finally, examples are shown, demonstrating the capabilities of the framework, with applications involving deposit insurance, lender of last resort, interbank market with clearing house, banks too big to fail, credit risk and capital requirement.
43

Modelo de apoio ao tutor na avaliação formativa mediada por agentes de software

FONSECA FILHO, João Batista d´Albuquerque 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T15:53:04Z (GMT). No. of bitstreams: 2 arquivo1897_1.pdf: 6264856 bytes, checksum: 635dd471c5e0761bdd9b1003e30f280f (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / As formas de avaliação do aprendizado em ambientes virtuais de ensino ainda são bastante discutidas. Enquanto o processo da avaliação somativa se encontra razoavelmente resolvido e regulamentado pela legislação brasileira através da necessidade de efetuar avaliações presenciais, o processo da avaliação formativa tem exigido que os educadores acompanhem a evolução dos alunos, mantendo-os motivados, elucidando dúvidas e aplicando avaliações periódicas no intuito de avaliar o desempenho e identificar dificuldades de aprendizado. Todo este cenário se torna ainda mais grave e demanda mais tempo de dedicação quando os cursos comportam grande contingente de alunos. Baseada no estudo das atividades de um tutor no processo da educação a distância, na abordagem colaborativa e na análise de competidores de processos de avaliações em outros ambientes virtuais de aprendizagem, esta dissertação apresenta um modelo de apoio ao tutor mediado por agentes de software no processo da avaliação formativa dos alunos. Este modelo é dotado de agentes de software que executam o papel de um companheiro de aprendizagem, monitorando as ações dos alunos quanto aos acessos ao ambiente virtual de aprendizagem e aos acessos aos materiais instrucionais do curso, disponibilizando um ambiente para promoção da colaboração e comunicação entre os alunos e o tutor, enviando mensagens aos alunos, convocando-os a se manterem ativos nas atividades dos cursos. O modelo também apresenta um ambiente onde é possível preparar, disponibilizar e corrigir as avaliações, compilando todos os resultados do desempenho dos alunos de forma a facilitar e fornecer informações que ajudem o tutor na complexa função da avaliação formativa
44

Um modelo para portais moveis baseado em middleware reflexivo e agentes moveis

Gialdi, Marcos Vinicius 03 August 2018 (has links)
Orientador: Edmundo Roberto Mauro Madeira / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-03T23:48:58Z (GMT). No. of bitstreams: 1 Gialdi_MarcosVinicius_M.pdf: 1923285 bytes, checksum: f6fb283d7e5132fe50ecf03493e3c971 (MD5) Previous issue date: 2004 / Resumo: A Computação Móvel possibilita o acesso a informação de qualquer lugar e a qualquer momento. Contudo, as preferências do usuário e as limitações geradas no ambiente móvel trazem a necessidade de personalizar o acesso aos serviços. Este trabalho descreve o ICoMP (I-centric Communication Mobile Portal), um modelo para Portal Móvel que oferece serviços aos usuários baseado no seu perfil (preferências, recursos disponíveis, localização e contexto). O ICoMP baseia-se na abordagem I-centric, onde os sistemas adaptam-se dinamicamente às necessidades do usuário e às mudanças no ambiente móvel. A infra-estrutura do ICoMP integra um middleware reflexivo (ReMMoC) e uma plataforma de Agentes Móveis (Grasshopper ) para dar suporte a dois tipos de acesso: a serviços oferecidos por agentes móveis e serviços implementados por tipos de middleware heterogêneos. Além disso, uma avaliação do modelo ICoMP é feita em termos de espaço de armazenamento e no suporte a aplicações móveis / Abstract: Mobile Computing enables information access anytime, anywhere. However, the needs of users and the constraints generated by the mobile environment raise the necessity to personalize access to services. This work describes ICoMP (I-centric Communication Mobile Portal), which is a mobile portal model that offers services based upon user profiles (these contain information including: preferences, available resources, location and environment context). Notably, ICoMP follows an I-Centric approach, whereby the system dynamically adapts to manage both user requirements and changes in the mobile environment. ICoMP's infrastructure integrates a reflective middleware (ReMMoC) and a mobile agent platform (Grasshopper) to support two types of access to information and application services, i.e. it interoperates with both services offered by mobile agents and also services implemented upon heterogeneous middleware. Moreover, we evaluate our implementation of the ICoMP portal in terms of memory footprint cost and support for mobile applications / Mestrado
45

Modelo de agentes e-BDI integrando confiança baseado em sistemas multi-contexto

Gelaim, Thiago Angelo January 2016 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016. / Made available in DSpace on 2016-05-24T17:54:52Z (GMT). No. of bitstreams: 1 339453.pdf: 2208666 bytes, checksum: ae7c28d4d2b6fa440042d4447582854e (MD5) Previous issue date: 2016 / Em sistemas multiagente, seus integrantes precisam interagir a fim de realizar seus objetivos. Existem situações em que entidades mal-intencionadas fazem parte do ambiente. Desta forma, para decidir com quem interagir é preciso considerar o comportamento dos candidatos. Neste contexto, mecanismos de confiança são utilizados como forma de proteção contra entidades fraudulentas. Na literatura são encontrados diversos modelos de confiança, em muitos casos considerando mais o aspecto funcional do modelo do que a sua influência no ciclo de raciocínio do agente. De acordo com a perspectiva do agente, um modelo de confiança é como uma  caixa-preta . O objetivo deste trabalho é propor um modelo de agente em que a confiança faça parte de seu raciocínio. O modelo proposto, inspirado em BDI, é definido a partir de um sistema multi-contexto e faz uso de um modelo computacional de emoções, visando vincular a subjetividade das experiências do agente com a definição de confiança.<br> / Abstract : In multiagent systems, its members need to interact in order to fulfill its goals. There are situations where malicious entities are inhabiting the environment. Thus, to decide with whom to interact it is necessary to consider the behavior of the candidates. In this context, trust mechanisms are used as a protection against fraudulent entities. The literature presents various trust models, in many cases considering more functional aspect of the model than its influence on the agent s reasoning cycle. According to the agent s perspective, a trust model is like a  black box . The goal of this work is to propose an agent model where trust is part of its reasoning. The proposed model, inspired by BDI, is defined as a multi-context system and makes use of a computational model of emotions aiming to link the subjectivity of the agent s experiences with the definition of trust.
46

Arquitetura para recuperação de objetos de aprendizagem - uma abordagem baseada em agentes inteligentes e relevance feedback /

Pöttker, Luciana Maria Vieira. January 2017 (has links)
Orientador: Edberto Ferneda / Banca: Elvis Fusco / Banca: Walter Moreira / Banca: Ana Carolina Simionato / Banca: Rachel Cristina Vesu Alves / Resumo: Desde a sua criação, a Web tem crescido a um ritmo sem precedentes, situação esta que exigiu mudanças na forma como a sociedade busca e tem acesso à informação. O incremento informacional foi observado em todas as áreas do conhecimento e, desde então, problemas relacionados à recuperação de informação são investigados. No escopo dessa investigação, são pesquisados objetos de aprendizagem que estejam descritos, em um padrão de metadados educacional, e mantidos em repositórios específicos para este fim. Todos os problemas e dificuldades relacionados à recuperação de informação são refletidos no contexto particular dos objetos de aprendizagem. Devido à natureza (multimídia) dos objetos de aprendizagem, a complexidade em recuperá-los se torna mais perceptível. Nesta tese, propõe-se um modelo de arquitetura para recuperação de objetos de aprendizagem baseado em uma integração de tecnologias de sistemas de recuperação de informação, metadados, relevance feedback e agentes inteligentes. O propósito fundamental da arquitetura para recuperação de objetos de aprendizagem é unificar a representação desses recursos educacionais que são disponibilizados em diferentes repositórios e permitir que o usuário realize buscas qualificadas para localizar os objetos de aprendizagem mais adequados para sua necessidade de informação. Esta pesquisa é classificada como qualitativa e de natureza aplicada, uma vez que se relaciona com o problema prático de recuperação de objetos de aprendizagem disponív... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The Web has been growing in a record speed since its creation and, therefore, such prospect has demanded changes in the way society seeks for and accesses information. Informational increment was evident in all fields of knowledge and since then, the relevant information retrieval issues have been investigated. In the scope of this investigation, we find researches in learning objects classified into an educational metadata pattern and kept in a specific repository. All the problems and complications related to such retrieval reflect in the learning objects particular context. The complexity in retrieving these learning objects becomes evident given their (multimedia) nature. Here, we suggest an architecture model to retrieve the aforementioned objects that is based on a combination of information retrieval system, metadata, relevance feedback, and intelligent agents. The main purpose of this architecture model is to unify the representation of these educational resources - that are available in a heterogeneous repository - and allow users to perform efficient searches in order to find the most suitable learning objects to their information needs. This is a qualitative and applied research once it relates to the practical problem of learning objects retrieval available on the Web. The main difference of this suggestion was to value - via relevance feedback - the importance of the user‟s inference in the process of such retrieval, in which the user establishes a dialog with the information retrieval system as to enhance the obtained results, and thus - being a cyclical process - it can be executed until he is pleased them. The conclusion is that an information retrieval system more efficient when its scope is enlarged from the different sources of data and allows the inference of the user when judging what he was presented with. / Doutor
47

Uma abordagem para incorporar mecanismos de inteligencia artificial a agentes moveis

Silva, Paulo Sergio da 11 August 2004 (has links)
Orientador: Manuel de Jesus Mendes / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-04T00:34:30Z (GMT). No. of bitstreams: 1 Silva_PauloSergioda_D.pdf: 1777936 bytes, checksum: 623cb05483de0ceb59da755ce1eb66ce (MD5) Previous issue date: 2004 / Resumo: Este trabalho contribui para a convergência de agentes móveis e agentes inteligentes através da proposta de um framework para incorporar técnicas de Inteligência Artificial (IA) a agentes móveis criados com os principais sistemas de mobilidade contemporâneos baseados em Java. Os requisitos a serem satisfeitos pelo framework são identificados e sua arquitetura é estabelecida. Um dos principais mecanismos de IA, o mecanismo de inferência com encadeamento progressivo baseado em regras, é implementado de acordo com o framework sugerido. Uma metodologia de desenvolvimento de software orientada a objetos e vários padrões de projeto são utilizados na concepção tanto do framework quanto do mecanismo de inferência. Os modelos resultantes são documentados através da Linguagem Unificada de Modelagem (UML) e as principais decisões de projeto, na forma de diretrizes a serem adotadas na criação de outros mecanismos. A proposta é avaliada através da construção de agentes móveis controlados pelo mecanismo desenvolvido e pelo levantamento do custo de transporte de seu código e dados. Os resultados mostram que o framework é viável e que o custo de transporte do mecanismo implementado é bem menor que o dos equivalentes encontrados na literatura / Abstract: This thesis contributes for the convergence of mobile and intelligent agents by proposing a framework for embedding Artificial Intelligence (AI) techniques in mobile agents built with the main actual Java-based mobile agent systems. The requirements to be satisfied by the framework are identified and its architecture is established. One of the most essential AI engines, the rule-based forward-chaining inference engine is implemented in agreement with the suggested framework. An object-oriented software development methodology and several design patterns are used in the conception of both, the framework and the inference engine. The resulting models are documented using the Unified Modeling Language (UML) and the main design decisions, as directions to be adopted in the development of other engines. The proposal is evaluated by the construction of mobile agents controlled by the developed engine and by the estimation of the transportation cost of the engine¿s code and data. The results show the framework is feasible and that the transportation cost of the implemented engine is much lower than the cost of similar engines found in literature / Doutorado / Engenharia de Computação / Doutor em Engenharia Elétrica
48

[en] AUTOMATION OF THE MANAGEMENT PROCESS OF THE TEST OF SOFTWARE / [pt] AUTOMAÇÃO DO PROCESSO DE GERÊNCIA DO TESTE DE SOFTWARE

ANDREW DINIZ DA COSTA 19 February 2013 (has links)
[pt] Teste de software é uma atividade crítica no processo de desenvolvimento de sistemas, principalmente devido ao aumento da complexidade das aplicações atuais e pelo impacto que tais aplicações podem gerar. Relacionado a essa complexidade, o paradigma de sistemas multiagentes tem sido utilizado especialmente quando entidades pró-ativas, autônomas, autoadaptáveis e distribuídas precisam ser desenvolvidas. Para acompanhar a criação, manutenção e execução dos testes nesses sistemas, torna-se necessária a adoção de um processo de gerência, pois prevê a realização das atividades de planejamento, projeto, execução e acompanhamento dos testes. Visando ajudar nessa gerência, a tese apresenta o Java self-Adaptive Agent Framework for Self- Test (JAAF mais T), framework que permite a criação de agentes autoadaptativos capazes de realizar autoteste, isto é, coordenar a execução dos testes necessários para validar suas autoadaptações. Como diversas informações são usadas para ajudar na gerência desses testes, documentá-las ajuda a entender como evoluir e executá-los. Baseada nessa preocupação, a tese oferece uma nova linguagem de modelagem chamada de UML Testing Profile for Coordination (UTP-C), perfil (profile) da UML que permite a modelagem dessas informações. Por fim, para automatizar o processo de gerência dos testes executados por agentes autoadaptativos, a tese apresenta ferramentas capazes de gerar de forma automática artefatos usados pelo JAAF mais T baseados em modelos UTP-C. / [en] Testing software systems has become a critical activity of software development over time. Especially when the development of complex systems, which are able to self-adapt theirs behaviors when necessary, is becoming extremely common. In this context, the multi-agent system (MAS) paradigm has been used especially when distributed, autonomous and pro-active entities are represented. Aiming to control the creation, maintenance and execution of tests on these systems, it is necessary to adopt a management process that considers the activities of planning, design, execution and monitoring of the tests. In order to help this management, the thesis presents the Java self-Adaptive Agent Framework for Self-Test (JAAF more T), that aims to allow the creation of selfadaptive agents that perform self-tests. Since several data are used to help the management of the tests, documenting them helps to understand how to evolve and execute them. Based on this concern, the thesis offers a new modeling language called UML Testing Profile for Coordination (UTP-C), profile of the UML that allows the modeling of these data. At last, but not least important, tools, which were created to automate the management of the tests executed for selfadaptive agents, are presented to generate useful artifacts used for instances of the JAAF more T based on UTP-C models.
49

[en] A MODEL FOR LEARNING EVALUATION USING SYNCHRONOUS TOOLS IN WEB-BASED LEARNING / [pt] UM MODELO PARA AVALIAÇÃO DE APRENDIZAGEM NO USO DE FERRAMENTAS SÍNCRONAS EM ENSINO MEDIADO PELA WEB

JOSE CARLOS TAVARES DA SILVA 30 September 2004 (has links)
[pt] Este trabalho apresenta um modelo de avaliação de aprendizagem em debates síncronos e presenciais mediados pela web. O modelo é construído para atender as necessidades da avaliação do ensino levado a efeito segundo três paradigmas metodológicos: a aprendizagem centrada no aprendiz, a aprendizagem colaborativa e a aprendizagem guiada por problemas. Uma máquina de estados é proposta para suporte à avaliação da participação do aprendiz, segundo a Teoria do Vínculo de Enrique Pichon Rivière, permitindo assim um juízo de valor sobre comportamentos observáveis e aferição de aprendizagem de conhecimentos em um processo de construção coletiva e baseada em problemas colocados como desafios para os aprendizes. O ambiente AulaNetTM é utilizado como referencial, dadas as suas características de servidor de conteúdo e por se constituir em um ambiente para ensino à distância cuja concepção permite o uso da metodologia de ensino cooperativo. O acoplamento dos sistemas foi concebido de modo a atender as diretivas de simplicidade e dependência estrutural mínima. Para o módulo de avaliação é suficiente acessar a base do AulaNetTM e transferir os dados para a base do mesmo, a fim de garantir a independência dos sistemas. Um padrão do tipo quadro-negro (blackboard) é projetado para implementar essas características. / [en] This work presents a model for learning evaluation to be used in web-based learning systems. This model is constructed to provide conditions for a correct use of three learning paradigms: Learner centered learning, Cooperative Learning and Problem Based Learning. A finite state machine is proposed to support the evaluation of the apprentice`s participation under the Vinculum Theory by Enrique Pichon Rivière. As designed, the teacher can do a judgement of the observable behavior of each student and make an evaluation of the knowledge learning in a collective construction process based on the PBL (Problem Based Learning) strategy. The AulaNetTM environment is used in this work because it has a well-designed content server structure and is strongly oriented towards collaborative learning. The binding of the proposed model with the AulaNetTM environment follows the guidelines of simplicity and minimal dependence of both systems. A blackboard architecture is implemented to get the characteristics of independence and low complexity described above.
50

Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.

Helen Cristina de Mattos Senefonte 13 November 2009 (has links)
O objetivo deste trabalho é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. O agente será responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas, cada uma das quais representada por um processo decisório distinto. O projeto envolve uma análise empírica baseada em resultados prévios da literatura, seguida de um estudo de variantes mistas de maximização de utilidade e minimização de custos associados às ações propostas pelos processos decisórios de Markov que compõem as sub-tarefas. Como resultado dessa análise são propostas as técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples. Os resultados experimentais obtidos indicam que tais heurísticas adaptadas e aplicadas às políticas de ações dos MDPs são capazes de proporcionar aceleração da convergência dos algoritmos de aprendizado autônomo em problemas com múltiplos objetivos.

Page generated in 0.0876 seconds