Return to search

Control and identification of non-linear systems using neural networks and reinforcement learning

Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2018. / Submitted by Fabiana Santos (fabianacamargo@bce.unb.br) on 2018-09-27T20:19:43Z
No. of bitstreams: 1
2018_LucasGuilhemdeMatos_RESUMO.pdf: 59314 bytes, checksum: fcca0edce88c4bbe8975f96cfb38ac6f (MD5) / Rejected by Fabiana Santos (fabianacamargo@bce.unb.br), reason: O arquivo PDF está errado. on 2018-10-08T21:05:29Z (GMT) / Submitted by Fabiana Santos (fabianacamargo@bce.unb.br) on 2018-10-08T21:06:22Z
No. of bitstreams: 1
2018_LucasGuilhemdeMatos.pdf: 22624129 bytes, checksum: 8246b13bfdcea5ae4862864196f406be (MD5) / Approved for entry into archive by Fabiana Santos (fabianacamargo@bce.unb.br) on 2018-10-09T20:24:27Z (GMT) No. of bitstreams: 1
2018_LucasGuilhemdeMatos.pdf: 22624129 bytes, checksum: 8246b13bfdcea5ae4862864196f406be (MD5) / Made available in DSpace on 2018-10-09T20:24:27Z (GMT). No. of bitstreams: 1
2018_LucasGuilhemdeMatos.pdf: 22624129 bytes, checksum: 8246b13bfdcea5ae4862864196f406be (MD5)
Previous issue date: 2018-08-24 / Fundação de Apoio a Pesquisa do Distrito Federal (FAP-DF). / Este trabalho propõe um contolador adaptativo utilizando redes neuras e aprendizado por reforço para lidar com não-linearidades e variância no tempo. Para a realização de testes, um sistema de nível de líquidos de quarta ordem foi escolhido por apresentar uma gama de constantes de tempo e por possibilitar a mudança de parâmetros. O sistema foi identificado com redes neurais para prever estados futuros com o objetivo de compensar o atraso e melhorar a performance do controlador. Diversos testes foram realizados com diversas redes neurais para decidir qual rede neural seria utilizada para cada tarefa pertinente ao controlador. Os parâmetros do controlador foram ajustados e testados para que o controlador pudesse alcançar parâmetros arbitrários de performance. O controlador foi testado e comparado com o PI tradicional para validação e mostrou caracteristicas adaptativas e melhoria de performance ao longo do tempo, além disso, o controlador desenvolvido não necessita de informação prévia do sistema. / This work presents a proposal of an adaptive controller using reinforcement learning and neural networks in order to deal with non-linearities and time-variance. To test the controller a fourth-order fluid level system was chosen because of its great range of time constants and the possibility of varying the system parameters. System identification was performed to predict future states of the system, bypass delay and enhance the controller’s performance. Several tests with different neural networks were made in order to decide which network would be assigned to which task. Various parameters of the controller were tested and tuned to achieve a controller that satisfied arbitrary specifications. The controller was tested against a conventional PI controller used as reference and has shown adaptive features and improvement during execution. Also, the proposed controller needs no previous information on the system in order to be designed.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/32804
Date02 March 2018
CreatorsMatos, Lucas Guilhem de
ContributorsBauchspiess, Adolfo
Source SetsIBICT Brazilian ETDs
LanguageInglês
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0025 seconds