• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 9
  • 1
  • Tagged with
  • 10
  • 10
  • 10
  • 6
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Aceleração do aprendizado por reforço em sistemas com múltiplos objetivos.

Helen Cristina de Mattos Senefonte 13 November 2009 (has links)
O objetivo deste trabalho é a implementação e análise de técnicas para aceleração do aprendizado por reforço em sistemas com múltiplos objetivos. Problemas com múltiplos objetivos, por sua vez, podem ser descritos de várias formas diferentes. O foco aqui é naqueles casos em que um único agente deve aprender simultaneamente e de modo online várias sub-tarefas independentes resultantes de uma decomposição a priori do problema em questão. O agente será responsável pelo aprendizado autônomo de um processo de seleção de ações em que pode ocorrer competição entre as várias sub-tarefas, cada uma das quais representada por um processo decisório distinto. O projeto envolve uma análise empírica baseada em resultados prévios da literatura, seguida de um estudo de variantes mistas de maximização de utilidade e minimização de custos associados às ações propostas pelos processos decisórios de Markov que compõem as sub-tarefas. Como resultado dessa análise são propostas as técnicas de aceleração do aprendizado baseadas em heurísticas testadas e estudadas no contexto de problemas de objetivos simples. Os resultados experimentais obtidos indicam que tais heurísticas adaptadas e aplicadas às políticas de ações dos MDPs são capazes de proporcionar aceleração da convergência dos algoritmos de aprendizado autônomo em problemas com múltiplos objetivos.
2

Partição espacial utilizando triangulação de Delaunay e Hiperplanos de SVM para classificação de padrões multiclasse

Luciana Babberg Abiuzi 14 July 2010 (has links)
As Máquinas de Vetores de Suporte (SVMs) são consideradas ferramentas com grande capacidade de generalização e são utilizadas em tarefas de classificação, clusterização e regressão. Foram originalmente criadas para trabalhar com problemas contendo duas classes, entretanto, muitas aplicações reais necessitam de um método para discriminação em múltiplas classes, como são os casos da identificação biométrica, categorização de textos, reconhecimento de caracteres, entre outros. Além das SVMs existem métodos de classificação puramente geométricos que são interessantes por sua rapidez, seu baixo custo em memória e sua capacidade de classificar dados linearmente separáveis. Um desses métodos é o Diagrama de Voronoi, que em conjunto com seu grafo dual conhecido por Triangulação de Delaunay, são aplicados em áreas como Arqueologia, Astronomia, Cartografia, Geometria Computacional, entre outras. Neste trabalho é proposto um mecanismo para utilizar a estrutura geométrica da Triangulação de Delaunay para definir o esquema de treinamento dos hiperplanos obtidos através das SVMs. A partir deste ponto, é proposta uma função para tratamento das regiões consideradas como não-classificáveis encontradas com a ocorrência das interseções entre os hiperplanos gerados. Com a aplicação dos métodos, as partições obtidas no plano permitem uma classificação multiclasse eficiente e com bons resultados de generalização mesmo com o uso de quantidade significativa de classes contendo poucas amostras.
3

Coordenação dos atuadores de robôs móveis com pernas usando aprendizado por reforço e múltiplos critérios : simulação e implementação

Jeeves Lopes dos Santos 19 August 2011 (has links)
Este trabalho apresenta uma solução para o problema de coordenação dos atuadores das pernas de robôs móveis levando em consideração múltiplos critérios. É assumido que a posição no tempo de cada atuador é descrita por uma função periódica a ser determinada iterativamente por um algoritmo de aprendizado por reforço. As pernas similares do robô são identificadas e agrupadas visando diminuir o número de funções que precisam ser determinadas. O desempenho do robô simulado é medido considerando: a) as velocidades de translação frontal e de rotação, b) a suavidade na locomoção do robô e c) o máximo torque e o consumo de energia dos atuadores. Também é investigada a utilização da transferência de conhecimento no intuito de agilizar o aprendizado em duas situações específicas: na acomodação a uma falha ocorrida e no aprendizado por partes, onde os critérios desejados para o modo de caminhar são inseridos gradativamente no aprendizado. As funções determinadas no ambiente de simulação pelo algoritmo de reforço são, então, usadas nos atuadores do robô real construído usando o kit de robótica educacional Bioloid Comprehensive Kit. O desempenho do robô real é, então, medido e comparado com o desempenho do robô simulado. Este trabalho apresenta quatro estudos de caso: um robô quadrúpede, um quadrúpede híbrido (com rodas livres acopladas aos pés), um trípode e um robô bípede. As soluções obtidas pela aplicação do método proposto são apresentadas e se mostram satisfatórias.
4

Projeto e construção de um barco inteligente com integração INS/GPS e bússola

Douglas Soares dos Santos 11 August 2011 (has links)
Este trabalho apresenta o projeto e construção de um barco inteligente, ou seja, com a capacidade de aprendizado e autônomo. Neste trabalho foi desenvolvida uma plataforma náutica dotada de sensores de posicionamento e de orientação visando gerar uma solução de navegação autônoma capaz de seguir uma trajetória pré-definida por um usuário. O barco foi construído a partir de uma estrutura náutica do tipo catamarã usando como sistema de propulsão rodas d';água impulsionadas por motores elétricos de corrente contínua. Foi projetado e instalado no barco um módulo embarcado contendo um computador de bordo, a eletrônica de acionamento dos motores, o sistema de comunicação e os seguintes sensores: plataforma inercial (composta por acelerômetros, girômetros e magnetômetros) e receptor GPS. O módulo embarcado se comunica com uma estação de controle em terra enviando a telemetria dos sensores e recebendo os comandos para o acionamento dos propulsores. A estação de controle foi escrita no ambiente de desenvolvimento MATLAB e implementa a solução de navegação autônoma do barco em uma interface gráfica amigável realizando os seguintes passos: 1) estimação do estado atual do barco usando fusão sensorial (INS/GPS e Bússola) baseada em Filtro de Kalman, 2) geração do comando para os propulsores por consulta à tabela de acionamento. A técnica de aprendizado por reforço Learning Automata foi usada em um ambiente de simulação, juntamente com o modelo dinâmico do barco, para gerar a tabela de acionamento dos propulsores. A solução proposta foi implementada e testada no barco real. Os resultados experimentais mostram que o barco segue uma trajetória pré-definida pelo usuário de forma autônoma com pequeno erro.
5

Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos

Luiz Antonio Celiberto Junior 06 June 2012 (has links)
O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porem, ela não é eficiente o bastante para ser usada em aplicações com exigências do mundo real devido ao tempo que o agente precisa para o aprendizado. Este trabalho propõe um mecanismo para a aceleração do aprendizado por reforço, utilizando transferência do aprendizado com a combinação de varias técnicas distintas, como, redes neurais artificiais, aprendizado por reforço, raciocínio baseado em casos e uso de heurística para aceleração do aprendizado, utilizando a semelhança entre domínios. Com o objetivo de avaliar o mecanismo proposto, implementou-se o algoritmo Q-Learning Acelerado por Transferência de Aprendizado (Q-Learning Accelerated by Transfer Learning - Q-LATL) que estende o conhecido algoritmo Q-Learning utilizando métodos de aproveitamento de casos para extração da função heurística, métodos estes que podem ser usados para a aceleração do aprendizado por reforço. Foram realizados experimentos utilizando a transferência de aprendizado para solucionar problemas em diversos domínios. Os resultados experimentais deste trabalho permitem concluir que a transferência do aprendizado, na forma como aplicada neste trabalho, melhora o desempenho do algoritmo de aprendizado por reforço utilizado.
6

Monitoramento de tráfego aéreo baseado em padrões de trajetórias de aeronaves

Ronald Annoni Junior 19 December 2012 (has links)
Este trabalho tem como objetivo principal propor um método, baseado em técnicas de aprendizagem de máquina, para a detecção de trajetórias anômalas em relação a um conjunto de trajetórias, com vista à aplicação em monitoramento de tráfego aéreo. Dadas as características do tráfego aéreo (regulamentação, economia, segurança) existe uma certa regularidade nas trajetórias das aeronaves de tal forma que o seu comportamento conjunto pode ser modelado e eventuais desvios desse modelo podem ser detectados. A fim de comprovar esta hipótese, dados reais de tráfego aéreo da área de controle terminal de São Paulo (TMA-SP) foram obtidos e armazenados em um sistema gerenciador de banco de dados. Aplicações de visualização foram implementadas para permitir um exame visual das trajetórias e um estimador de densidade por função de núcleo multivariado foi utilizado para verificar as direções predominantes do tráfego. Um modelo de representação das trajetórias baseado na Transformada Discreta de Fourier é proposto e utilizado na preparação de um conjunto de trajetórias que alimentam um algoritmo de agrupamento. Este algoritmo foi capaz de identificar os procedimentos principais do tráfego, e as trajetórias rotuladas por este procedimento foram utilizadas por um método proposto de classificação de pontos individuais de trajetórias que obteve êxito na detecção de trajetórias anômalas, confirmando as hipóteses deste trabalho.
7

ERG-ARCH : a reinforcement learning architecture for propositionally constrained multi-agent state spaces

Anderson Viçoso de Araújo 06 October 2014 (has links)
The main goal of this work is to present an approach that ?nds an appropriate set of sequential actions for a group of cooperative agents interacting over a constrained environment. This search is considered a complex task for autonomous agents and is not possible to use default reinforcement learning algorithms to learn the adequate policy. In this thesis, a technique that deals with propositionally constrained state spaces and makes use of a Reinforcement Learning algorithm based on Markov Decision Process is proposed. A new model is also presented which formally de?nes this restricted search space. By so doing, this work aims at reducing the overall exploratory need, thus improving the performance of the learning algorithm. To constrain the state space the concept of extended reachability goals is employed. Through them it is possible to de?ne an objective to be preserved during the iteration with the environment and another that de?nes a goal state. In this cooperative environment, the information about the propositions is shared among the agents during its interaction. An architecture to solve problems in such environments is also presented. Experiments to validate the proposed algorithm were performed on different test cases and showed interesting results. A performance evaluation against standard Reinforcement Learning techniques showed that by extending autonomous learning with propositional constraints updated along the learning process can produce faster convergence to adequate policies. The best results achieved present an important reduction over execution time (34,32%) and number of iterations (67.94%). This occurs due to the early state space reduction caused by shared information on state space constraints.
8

Planejamento e controle para a construção autônoma de estruturas tridimensionais utilizando quadrirrotores

Sérgio Ronaldo Barros dos Santos 28 November 2014 (has links)
Esta tese propõe um novo paradigma para a construção de estruturas tridimensionais onde robôs aéreos do tipo quadrirrotores são usados para capturar, transportar e montar diferentes elementos estruturais em um ambiente dinâmico e não estruturado. Tarefas complexas de construção que utilizam robôs móveis são caracterizadas por três problemas fundamentais: 1) O planejamento da construção das estruturas; 2) A geração das trajetórias dos robôs; e 3) O controle de rastreamento das trajetórias durante a execução. Uma arquitetura de planejamento é proposta para resolver simultaneamente os dois primeiros problemas. Essa arquitetura: 1) Gera de forma iterativa planos exequíveis de montagem das estruturas e de movimentação dos robôs usando a técnica de aprendizado por reforço Learning Automata e o algoritmo de busca heurística A*; 2) Considera as limitações de potência dos quadrirrotores disponíveis, as restrições de construção das estruturas e a natureza dinâmica do ambiente; e 3) Utiliza um método de resolução de conflitos para planejar as velocidades de translação e selecionar os pontos de parada de cada quadrirrotor. Para solucionar o terceiro problema, a técnica de aprendizado por reforço Learning Automata é usada com a finalidade de projetar e otimizar os controladores de atitude e de rastreamento de trajetórias dos quadrirrotores. Em razão da dinâmica não linear dos robôs aéreos, das perturbações externas (p. ex., o vento e o efeito do solo), e da variação de carga durante o processo de construção, a solução desse problema não é trivial. Testes simulados e experimentais do sistema autônomo de construção de diferentes estruturas tridimensionais (cubo, torre, pirâmide e parede), com até quatro quadrirrotores, são apresentados para demonstrar a generalidade da solução proposta.
9

Modelos de regressão para análise de demanda de formação de mão de obra qualificada da indústria local

Marcus Vinicius Begossi 24 September 2015 (has links)
O Serviço Nacional de Aprendizagem Industrial (SENAI) foi criado em 1942 com o objetivo de oferecer um ensino profissional de qualidade para a recém-criada indústria de base e, passados mais de 70 anos de sua criação, permanece firme no propósito de aumentar a competitividade do setor industrial. Considerando as unidades escolares do SENAI no Estado de São Paulo, verifica-se, como grande desafio, manter a oferta de cursos alinhada à demanda das indústrias. Para tanto, é imprescindível que haja rapidez na tomada de decisão referente à adequação e renovação da infraestrutura instalada. Com base no problema exposto, o presente trabalho visa verificar a quantidade de mão de obra qualificada requerida pelas indústrias da região onde estão instaladas as unidades do SENAI - SP, utilizando-se de modelos preditivos de regressão que auxiliem os gestores no direcionamento de novos investimentos. Os recursos empregados foram a consulta aos especialistas de diversas áreas do SENAI-SP, assim como a literatura e trabalhos acadêmicos atinentes ao tema. Como métodos, utilizou-se questionários, pesquisas - exploratória, bibliográfica e documental - mineração de dados e ferramentas de regressão linear e não linear, com as variáveis identificadas, para verificar qual das regressões apresenta melhor capacidade preditiva para a demanda por formação de mão de obra. Em particular, o modelo de regressão não linear considerado é uma rede neural artificial feedforward, treinada com o algoritmo backpropagtion para atualização de pesos. Os dados utilizados nos modelos de regressão referem-se à região de Campinas/SP, com o intuito de identificar a necessidade da indústria por mão de obra formada no curso Técnico em Eletrônica. A rede neural artificial foi o modelo de regressão que apresentou o melhor desempenho preditivo da demanda, constituindo-se, desta forma, como um importante instrumento de auxílio ao processo decisório dos gestores das unidades escolares do SENAI-SP em funcionamento.
10

Especificação e verificação formal de um modelo de STI-PBL por redes de PETRI coloridas

Eliane Santiago Ramos 06 March 2009 (has links)
Apresenta-se neste trabalho uma abordagem de Redes de Petri Coloridas para especificação e verificação formal de um modelo de Sistema Tutor Inteligente que utiliza a Aprendizagem Baseada em Problemas como estratégia pedagógica. A especificação e a verificação formal permitem verificar se as funcionalidades planejadas do modelo pedagógico serão realizadas, antes da etapa de implementação do sistema. Adicionalmente, o mecanismo de inferência avalia as informações coletadas nas atividades de interação do aprendiz no processo de solução de problemas e infere, por simulação de Cadeias de Markov Monte Carlo, a probabilidade de o aprendiz resolver um problema, com o propósito de capacitar o sistema à tomada de decisões. Experimentos iniciais indicam consistência geral e benefícios da proposta.

Page generated in 0.1218 seconds