Return to search

Aplicação de técnicas de aprendizado por reforço à alocação de recursos e ao escalonamento de usuários em sistemas de telecomunicações

Tese (doutorado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014. / Submitted by Ana Cristina Barbosa da Silva (annabds@hotmail.com) on 2014-10-29T17:12:14Z
No. of bitstreams: 1
2014_JoãoPauloLeite.pdf: 1958489 bytes, checksum: d568f21cf82d82b88cf04854da5a428b (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-11-18T13:35:11Z (GMT) No. of bitstreams: 1
2014_JoãoPauloLeite.pdf: 1958489 bytes, checksum: d568f21cf82d82b88cf04854da5a428b (MD5) / Made available in DSpace on 2014-11-18T13:35:12Z (GMT). No. of bitstreams: 1
2014_JoãoPauloLeite.pdf: 1958489 bytes, checksum: d568f21cf82d82b88cf04854da5a428b (MD5) / A adaptação de enlace e o escalonamento de usuários são aspectos cruciais dos atuais sistemas de comunicação devido à demanda por alta eficiência espectral, de forma a se obter a maior vazão possível com base nos recursos espectrais disponíveis, e à grande variedade de aplicações de usuário, cada uma com diferentes requisitos de qualidade de serviço. A implantação tanto da adaptação de enlace quanto de algoritmos de seleção e escalonamento de usuários impõe certos desafios, pois as soluções atualmente utilizadas consideram modelos idealizados de terminais de transmissão e de recepção, bem como um canal de comunicação de natureza invariante explicações cujas exigências são imutáveis.Nesse contexto, técnicas de aprendizado de máquina podem ser utilizadas como uma forma de superar as limitações impostas pelas técnicas tradicionais de modelagem e solução analítica dos problemas supracitados. Este trabalho apresenta como primeira contribuição uma solução para o problema de adaptação de enlace por modulação e codificação adaptativas em sistemas multiportadora utilizando técnicas de aprendizado por reforço por estados contínuos. Comosegunda contribuição, ainda com respeito à adaptação de enlace, o trabalho propõe a utilização do aprendizado por reforço para a solução do problema de bit loading em sistemas multiportadora.Como terceira contribuição, o trabalho propõe um algoritmo de seleção e escalonamento deusuários baseado na estratégia de aprendizado por reforço multi-objetivo, como uma forma delidar com os diferentes requisitos de qualidade de serviço que são impostos pela heterogeneidadedas aplicações que trafegam nas redes de comunicação atuais. Em particular, é considerado o problema de escalonamento de tráfego sensível ao atraso. Resultados de simulação mostram que as soluções propostas, baseadas em aprendizado por reforço, são capazes de explorar a variabilidade do meio de transmissão, de forma a suplantar as perdas que são introduzidas pela modelagem idealizada dos terminais de comunicação. _______________________________________________________________________________________ ABSTRACT / Link adaptation and scheduling are crucial aspects of communication systems since highspectral efficiency is required in order to obtain the highest throughput given the availablespectrum resources and base stations should be able to service a wide range of quality of servicerequirements.In this context, machine learning techniques can be used as a way to overcome thelimitations imposed by traditional modeling techniques of the aforementioned problems. The firstcontribution of this thesis is to propose a solution to the problem of link adaptation for adaptivemodulation and coding in multicarrier systems using a continuous-state reinforcement learningapproach. As a second contribution, this thesis presents a solution to the bit loading problem inmulticarrier systems by means of reinforcement learning.As a third contribution, an algorithm for user selection and scheduling based on multiobjectivereinforcement is proposed. In particular, the scheduling of delay-sensitive traffic isconsidered. Simulation results show that the proposed solutions, based on reinforcement learning,are able to exploit the variability of the transmission medium and overcome the losses that areintroduced by idealized models of communication terminals and the communication channel.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/16916
Date30 May 2014
CreatorsLeite, João Paulo
ContributorsCarvalho, Paulo Henrique Portela de
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0019 seconds