Global ETD Search

1	Aprendizagem, retenção e transferência de uma nova habilidade motora em crianças: comparação entre os efeitos da prática mental e física / Learning, retention and transfer of a new motor skill in children: comparison between mental and physical practice Asa, Sabrina Kyoko de Paula 08 August 2012 (has links) O processo de aprendizagem motora permite, por meio de mudanças nos padrões de ativação de redes neurais, a consolidação de modelos internos dos movimentos. Atualmente sabe-se que esses modelos internos podem ser desenvolvidos não só pela prática física, mas também pela prática mental, definida como um ensaio mental repetido dos movimentos, sem a sua execução. Essa forma de prática permitiria a formação de um modelo interno mais flexível e independente do efetor. Embora a prática mental esteja sendo amplamente utilizada para o treino esportivo e a reabilitação em adultos, sua utilização em crianças ainda é muito restrita. Isto se deve, em parte, pela escassez de estudos que mostrem seus efeitos em crianças. Assim, o objetivo desse estudo foi comparar os efeitos da prática física e mental para a capacidade de aprender e reter uma nova habilidade motora de movimentos sequenciais de oposição de dedos, transferir essa aprendizagem para uma sequência reversa de movimentos e para a mão contralateral, não treinada, em crianças de 9 a 10 anos de idade. Participaram deste estudo 36 crianças destras com idade entre 9 e 10 anos divididas aleatoriamente em três grupos: grupo de prática mental (PM), composto por 12 crianças com média de idade de 9,9±0,3 anos; o grupo de prática física (PF), composto por 12 crianças com média de idade de 10±0,5 anos; e o grupo sem prática (SP), composto por 12 crianças de 9,9±0,4 anos. Os grupos de PM e PF foram submetidos a uma sessão de treino com 2400 repetições realizadas com a mão direita, sendo que o primeiro realizou a prática de forma imaginativa e o segundo a prática física. O grupo SP realizou uma atividade de pintura com duração similar ao treino dos demais grupos. O desempenho da sequência de movimentos que recebeu treinamento (ST), dos três grupos foi avaliado nas mesmas condições antes do treino (AT), e após 5 minutos (DT), 4 (4dDT), 7 (7dDT), 14 (14dDT), e 28 (28dDT), dias após o término do treinamento. O desempenho da sequência reversa a treinada (SR), realizada pela mão direita e o da ST na mão esquerda, não treinada (MNT), foi avaliado AT, DT, 7dDT e 28dDT. Os resultados obtidos por meio da ANOVA para medidas repetidas mostraram que não houve diferença entre os efeitos da PM e PF para a aprendizagem, retenção de curta e longa duração. Por outro lado, a ANOVA mostrou que, após o treino, a SR alcançou o mesmo desempenho da ST, bem como a MNT alcançou o mesmo desempenho da MT para a ST, apenas para o grupo que realizou a PM. Adicionalmente, conforme o esperado, o grupo SP não apresentou ganhos significativos de desempenho. Assim, baseados nesses resultados, pode-se concluir que crianças de 9 e 10 anos são capazes de aprender novas habilidades por meio da prática mental, que proporcionou os mesmos efeitos da prática física para a aprendizagem, retenção de curta e longa duração, e efeitos superiores para a transferência entre tarefas e intermanual / Motor learning allows the consolidation of internal models of movement through activation patterns changes of neural networks. Currently it is known that these internal models can be developed not only by physical practice, but also by mental practice, defined as a mental rehearsal of movements repeated without the overt movement. Mental practice allows an internal model formation more flexible and independent of the effector. Although mental practice has been widely used for sports training and adults rehabilitation, pediatric use is still very limited. This is due, in part, to lack of studies which demonstrate effects in children. The objective of this study was to compare the effects of physical and mental practice on learning, retention of a new motor ability of sequential movements of fingers opposition and transfer this learning to a reverse sequence of movements and to the contralateral untrained hand, 9-10 years old children. This study included 36 right-handed children aged between 9 and 10 years old randomly allocated into three groups: mental practice (MP), composed of 12 children with a mean age of 9.9 ± 0.3 years, physical practice group (PP), composed of 12 children with mean age 10 ± 0.5 years, and the group without practice (NP), composed of 12 children aged 9.9 ± 0.4 years. The PP and MP groups were submitted to one session of training with 2400 repetitions with the dominant hand, and MP group trained using only mental rehearsal of movements PP group trained executing the movements. The NP group had a painting activity with similar duration of other groups. The performance of the sequence of movements that received training (TS) of the three groups was evaluated under the same conditions before training (BT), and after 5 minutes (AT), 4 (4dAT), 7 (7dAT), 14 (14dAT), and 28 (28dAT) days after training. The performance of the reverse sequence (RS) by the right trained hand (TH) and the performance of the trained sequence (TS) by the left untrained hand (UTH) was evaluated BT, AT, 7dAT and 28dAT. The results obtained by repeated measures ANOVA showed no differences between MP and PP for learning, retention of short and long term retention. Moreover, ANOVA revealed that, after training, only the MP group reached the same performance of the TS and RS, and UTH reached the same performance of the TS for the HT. Additionally, as expected, the NP group did not show significant performance gains. Thus, based on these results, it is possible to conclude that children aged 9 and 10 years old are able to learn new skills through mental practice, which provided the same effects of physical practice for learning, short and long term retention and higher effects for transfer between tasks and hands Aprendizado motor Mental practice Motor learning Prática mental Transfer of learning Transferência do aprendizado
2	Desenvolvimento e validação de um sistema de identificação de emoções por visão computacional e redes neurais convolucionais com transferência de aprendizado Matos, Hamilton de 07 August 2017 (has links) Submitted by Marta Toyoda (1144061@mackenzie.br) on 2018-02-26T19:51:31Z No. of bitstreams: 2 HAMILTON DE MATOS.pdf: 25340069 bytes, checksum: 42b3c3c262d4682b8240b3cc157a63b8 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Paola Damato (repositorio@mackenzie.br) on 2018-04-28T16:04:20Z (GMT) No. of bitstreams: 2 HAMILTON DE MATOS.pdf: 25340069 bytes, checksum: 42b3c3c262d4682b8240b3cc157a63b8 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-04-28T16:04:20Z (GMT). No. of bitstreams: 2 HAMILTON DE MATOS.pdf: 25340069 bytes, checksum: 42b3c3c262d4682b8240b3cc157a63b8 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-08-07 / This research aims to establish a methodology for the creation of a convolutional neural network in situations where there is a reduced number of data for training. The scenario adopted is the identi_cation of facial expressions in images and their respective emotions. Through the validation of the proposed method, in addition to the availability of the methodology itself, a public access interface is also available for providing information about the emotions detected in an image. In this context, human behavior studies such as Paul Ekman's analysis and definitions of universal emotions are used. Diferent techniques of computer vision and machine learning with convolutional neural networks were used to create the software. The aim of this work is to verify the possibility of real-time analysis, aiming to provide data in situations in which feedback can be fundamental for making certain decisions (eg in reactions in statements, for example). Even on a reduced training data set, it was possible to achieve an average final test accuracy of 65 % with an average training time of ten minutes. / Esta pesquisa tem como objetivo estabelecer uma metodologia para a criação de uma rede neural convolucional em situações em que exista um número reduzido de dados para treinamento. O cenário adotado é o de identificação de expressões faciais em imagens e suas respectivas emoções. Por meio da validação do método proposto, além da disponibilização da própria metodologia, também é disponibilizada uma interface de acesso público que apresenta informações a respeito das emoções detectadas em uma imagem. Neste contexto, são utilizados estudos de comportamento humano como a análise feita por Paul Ekman e as definições de emoções universais. Para criação do software, foram utilizadas diferentes técnicas de visão computacional e técnicas de aprendizagem de máquina com redes neurais convolucionais. Pretende-se, com este trabalho, verificar a possibilidade de leituras em tempo real, tendo como objetivo fornecer dados em situações nas quais os feedbacks podem ser fundamentais para a tomada de determinadas decisões (como em reações em depoimentos, por exemplo). Como resultados mesmo sobre um conjunto de dados de treinamento reduzido, foi possível conseguir uma acurácia de teste final média de 65% com tempo médio de treinamento de dez minutos. expressões faciais visão computacional aprendizagem de maquinha redes neurais convolucionais transferência de aprendizado CNPQ::ENGENHARIAS
3	Aprendizagem, retenção e transferência de uma nova habilidade motora em crianças: comparação entre os efeitos da prática mental e física / Learning, retention and transfer of a new motor skill in children: comparison between mental and physical practice Sabrina Kyoko de Paula Asa 08 August 2012 (has links) O processo de aprendizagem motora permite, por meio de mudanças nos padrões de ativação de redes neurais, a consolidação de modelos internos dos movimentos. Atualmente sabe-se que esses modelos internos podem ser desenvolvidos não só pela prática física, mas também pela prática mental, definida como um ensaio mental repetido dos movimentos, sem a sua execução. Essa forma de prática permitiria a formação de um modelo interno mais flexível e independente do efetor. Embora a prática mental esteja sendo amplamente utilizada para o treino esportivo e a reabilitação em adultos, sua utilização em crianças ainda é muito restrita. Isto se deve, em parte, pela escassez de estudos que mostrem seus efeitos em crianças. Assim, o objetivo desse estudo foi comparar os efeitos da prática física e mental para a capacidade de aprender e reter uma nova habilidade motora de movimentos sequenciais de oposição de dedos, transferir essa aprendizagem para uma sequência reversa de movimentos e para a mão contralateral, não treinada, em crianças de 9 a 10 anos de idade. Participaram deste estudo 36 crianças destras com idade entre 9 e 10 anos divididas aleatoriamente em três grupos: grupo de prática mental (PM), composto por 12 crianças com média de idade de 9,9±0,3 anos; o grupo de prática física (PF), composto por 12 crianças com média de idade de 10±0,5 anos; e o grupo sem prática (SP), composto por 12 crianças de 9,9±0,4 anos. Os grupos de PM e PF foram submetidos a uma sessão de treino com 2400 repetições realizadas com a mão direita, sendo que o primeiro realizou a prática de forma imaginativa e o segundo a prática física. O grupo SP realizou uma atividade de pintura com duração similar ao treino dos demais grupos. O desempenho da sequência de movimentos que recebeu treinamento (ST), dos três grupos foi avaliado nas mesmas condições antes do treino (AT), e após 5 minutos (DT), 4 (4dDT), 7 (7dDT), 14 (14dDT), e 28 (28dDT), dias após o término do treinamento. O desempenho da sequência reversa a treinada (SR), realizada pela mão direita e o da ST na mão esquerda, não treinada (MNT), foi avaliado AT, DT, 7dDT e 28dDT. Os resultados obtidos por meio da ANOVA para medidas repetidas mostraram que não houve diferença entre os efeitos da PM e PF para a aprendizagem, retenção de curta e longa duração. Por outro lado, a ANOVA mostrou que, após o treino, a SR alcançou o mesmo desempenho da ST, bem como a MNT alcançou o mesmo desempenho da MT para a ST, apenas para o grupo que realizou a PM. Adicionalmente, conforme o esperado, o grupo SP não apresentou ganhos significativos de desempenho. Assim, baseados nesses resultados, pode-se concluir que crianças de 9 e 10 anos são capazes de aprender novas habilidades por meio da prática mental, que proporcionou os mesmos efeitos da prática física para a aprendizagem, retenção de curta e longa duração, e efeitos superiores para a transferência entre tarefas e intermanual / Motor learning allows the consolidation of internal models of movement through activation patterns changes of neural networks. Currently it is known that these internal models can be developed not only by physical practice, but also by mental practice, defined as a mental rehearsal of movements repeated without the overt movement. Mental practice allows an internal model formation more flexible and independent of the effector. Although mental practice has been widely used for sports training and adults rehabilitation, pediatric use is still very limited. This is due, in part, to lack of studies which demonstrate effects in children. The objective of this study was to compare the effects of physical and mental practice on learning, retention of a new motor ability of sequential movements of fingers opposition and transfer this learning to a reverse sequence of movements and to the contralateral untrained hand, 9-10 years old children. This study included 36 right-handed children aged between 9 and 10 years old randomly allocated into three groups: mental practice (MP), composed of 12 children with a mean age of 9.9 ± 0.3 years, physical practice group (PP), composed of 12 children with mean age 10 ± 0.5 years, and the group without practice (NP), composed of 12 children aged 9.9 ± 0.4 years. The PP and MP groups were submitted to one session of training with 2400 repetitions with the dominant hand, and MP group trained using only mental rehearsal of movements PP group trained executing the movements. The NP group had a painting activity with similar duration of other groups. The performance of the sequence of movements that received training (TS) of the three groups was evaluated under the same conditions before training (BT), and after 5 minutes (AT), 4 (4dAT), 7 (7dAT), 14 (14dAT), and 28 (28dAT) days after training. The performance of the reverse sequence (RS) by the right trained hand (TH) and the performance of the trained sequence (TS) by the left untrained hand (UTH) was evaluated BT, AT, 7dAT and 28dAT. The results obtained by repeated measures ANOVA showed no differences between MP and PP for learning, retention of short and long term retention. Moreover, ANOVA revealed that, after training, only the MP group reached the same performance of the TS and RS, and UTH reached the same performance of the TS for the HT. Additionally, as expected, the NP group did not show significant performance gains. Thus, based on these results, it is possible to conclude that children aged 9 and 10 years old are able to learn new skills through mental practice, which provided the same effects of physical practice for learning, short and long term retention and higher effects for transfer between tasks and hands Aprendizado motor Prática mental Transferência do aprendizado Mental practice Motor learning Transfer of learning
4	Deteção de Spam baseada na evolução das características com presença de Concept Drift Henke, Márcia 30 March 2015 (has links) Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-11-12T20:17:58Z No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-11-16T18:36:36Z (GMT) No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-11-16T18:43:03Z (GMT) No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) / Made available in DSpace on 2015-11-16T18:43:03Z (GMT). No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) Previous issue date: 2015-03-30 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Electronic messages (emails) are still considered the most significant tools in business and personal applications due to their low cost and easy access. However, e-mails have become a major problem owing to the high amount of junk mail, named spam, which fill the e-mail boxes of users. Among the many problems caused by spam messages, we may highlight the fact that it is currently the main vector for the spread of malicious activities such as viruses, worms, trojans, phishing, botnets, among others. Such activities allow the attacker to have illegal access to penetrating data, trade secrets or to invade the privacy of the sufferers to get some advantage. Several approaches have been proposed to prevent sending unsolicited e-mail messages, such as filters implemented in e-mail servers, spam message classification mechanisms for users to define when particular issue or author is a source of spread of spam and even filters implemented in network electronics. In general, e-mail filter approaches are based on analysis of message content to determine whether or not a message is spam. A major problem with this approach is spam detection in the presence of concept drift. The literature defines concept drift as changes occurring in the concept of data over time, as the change in the features that describe an attack or occurrence of new features. Numerous Intrusion Detection Systems (IDS) use machine learning techniques to monitor the classification error rate in order to detect change. However, when detection occurs, some damage has been caused to the system, a fact that requires updating the classification process and the system operator intervention. To overcome the problems mentioned above, this work proposes a new changing detection method, named Method oriented to the Analysis of the Development of Attacks Characteristics (MECA). The proposed method consists of three steps: 1) classification model training; 2) concept drift detection; and 3) transfer learning. The first step generates classification models as it is commonly conducted in machine learning. The second step introduces two new strategies to avoid concept drift: HFS (Historical-based Features Selection) that analyzes the evolution of the features based on over time historical; and SFS (Similarity-based Features Selection) that analyzes the evolution of the features from the level of similarity obtained between the features vectors of the source and target domains. Finally, the third step focuses on the following questions: what, how and when to transfer acquired knowledge. The answer to the first question is provided by the concept drift detection strategies that identify the new features and store them to be transferred. To answer the second question, the feature representation transfer approach is employed. Finally, the transfer of new knowledge is executed as soon as changes that compromise the classification task performance are identified. The proposed method was developed and validated using two public databases, being one of the datasets built along this thesis. The results of the experiments shown that it is possible to infer a threshold to detect changes in order to ensure the classification model is updated through knowledge transfer. In addition, MECA architecture is able to perform the classification task, as well as the concept drift detection, as two parallel and independent tasks. Finally, MECA uses SVM machine learning algorithm (Support Vector Machines), which is less adherent to the training samples. The results obtained with MECA showed that it is possible to detect changes through feature evolution monitoring before a significant degradation in classification models is achieved. / As mensagens eletrônicas (e-mails) ainda são consideradas as ferramentas de maior prestígio no meio empresarial e pessoal, pois apresentam baixo custo e facilidade de acesso. Por outro lado, os e-mails tornaram-se um grande problema devido à elevada quantidade de mensagens não desejadas, denominadas spam, que lotam as caixas de emails dos usuários. Dentre os diversos problemas causados pelas mensagens spam, destaca-se o fato de ser atualmente o principal vetor de propagação de atividades maliciosas como vírus, worms, cavalos de Tróia, phishing, botnets, dentre outros. Tais atividades permitem ao atacante acesso indevido a dados sigilosos, segredos de negócios ou mesmo invadir a privacidade das vítimas para obter alguma vantagem. Diversas abordagens, comerciais e acadêmicas, têm sido propostas para impedir o envio de mensagens de e-mails indesejados como filtros implementados nos servidores de e-mail, mecanismos de classificação de mensagens de spam para que os usuários definam quando determinado assunto ou autor é fonte de propagação de spam e até mesmo filtros implementados em componentes eletrônicos de rede. Em geral, as abordagens de filtros de e-mail são baseadas na análise do conteúdo das mensagens para determinar se tal mensagem é ou não um spam. Um dos maiores problemas com essa abordagem é a deteção de spam na presença de concept drift. A literatura conceitua concept drift como mudanças que ocorrem no conceito dos dados ao longo do tempo como a alteração das características que descrevem um ataque ou ocorrência de novas características. Muitos Sistemas de Deteção de Intrusão (IDS) usam técnicas de aprendizagem de máquina para monitorar a taxa de erro de classificação no intuito de detetar mudança. Entretanto, quando a deteção ocorre, algum dano já foi causado ao sistema, fato que requer atualização do processo de classificação e a intervenção do operador do sistema. Com o objetivo de minimizar os problemas mencionados acima, esta tese propõe um método de deteção de mudança, denominado Método orientado à Análise da Evolução das Características de Ataques (MECA). O método proposto é composto por três etapas: 1) treino do modelo de classificação; 2) deteção de mudança; e 3) transferência do aprendizado. A primeira etapa emprega modelos de classificação comumente adotados em qualquer método que utiliza aprendizagem de máquina. A segunda etapa apresenta duas novas estratégias para contornar concept drift: HFS (Historical-based Features Selection) que analisa a evolução das características com base no histórico ao longo do tempo; e SFS (Similarity based Features Selection) que observa a evolução das características a partir do nível de similaridade obtido entre os vetores de características dos domínios fonte e alvo. Por fim, a terceira etapa concentra seu objetivo nas seguintes questões: o que, como e quando transferir conhecimento adquirido. A resposta à primeira questão é fornecida pelas estratégias de deteção de mudança, que identificam as novas características e as armazenam para que sejam transferidas. Para responder a segunda questão, a abordagem de transferência de representação de características é adotada. Finalmente, a transferência do novo conhecimento é realizada tão logo mudanças que comprometam o desempenho da tarefa de classificação sejam identificadas. O método MECA foi desenvolvido e validado usando duas bases de dados públicas, sendo que uma das bases foi construída ao longo desta tese. Os resultados dos experimentos indicaram que é possível inferir um limiar para detetar mudanças a fim de garantir o modelo de classificação sempre atualizado por meio da transferência de conhecimento. Além disso, um diferencial apresentado no método MECA é a possibilidade de executar a tarefa de classificação em paralelo com a deteção de mudança, sendo as duas tarefas independentes. Por fim, o MECA utiliza o algoritmo de aprendizagem de máquina SVM (Support Vector Machines), que é menos aderente às amostras de treinamento. Os resultados obtidos com o MECA mostraram que é possível detetar mudanças por meio da evolução das características antes de ocorrer uma degradação significativa no modelo de classificação utilizado. Aprendizagem de máquina Deteção de spam Transferência de aprendizado Concept drift Machine learning Intrusion detection Transfer learning
5	Knowledge reuse for deep reinforcement learning. / Reutilização do conhecimento para aprendizado por reforço profundo. Glatt, Ruben 12 June 2019 (has links) With the rise of Deep Learning the field of Artificial Intelligence (AI) Research has entered a new era. Together with an increasing amount of data and vastly improved computing capabilities, Machine Learning builds the backbone of AI, providing many of the tools and algorithms that drive development and applications. While we have already achieved many successes in the fields of image recognition, language processing, recommendation engines, robotics, or autonomous systems, most progress was achieved when the algorithms were focused on learning only a single task with little regard to effort and reusability. Since learning a new task from scratch often involves an expensive learning process, in this work, we are considering the use of previously acquired knowledge to speed up the learning of a new task. For that, we investigated the application of Transfer Learning methods for Deep Reinforcement Learning (DRL) agents and propose a novel framework for knowledge preservation and reuse. We show, that the knowledge transfer can make a big difference if the source knowledge is chosen carefully in a systematic approach. To get to this point, we provide an overview of existing literature of methods that realize knowledge transfer for DRL, a field which has been starting to appear frequently in the relevant literature only in the last two years. We then formulate the Case-based Reasoning methodology, which describes a framework for knowledge reuse in general terms, in Reinforcement Learning terminology to facilitate the adaption and communication between the respective communities. Building on this framework, we propose Deep Case-based Policy Inference (DECAF) and demonstrate in an experimental evaluation the usefulness of our approach for sequential task learning with knowledge preservation and reuse. Our results highlight the benefits of knowledge transfer while also making aware of the challenges that come with it. We consider the work in this area as an important step towards more stable general learning agents that are capable of dealing with the most complex tasks, which would be a key achievement towards Artificial General Intelligence. / Com a evolução da Aprendizagem Profunda (Deep Learning), o campo da Inteligência Artificial (IA) entrou em uma nova era. Juntamente com uma quantidade crescente de dados e recursos computacionais cada vez mais aprimorados, o Aprendizado de Máquina estabelece a base para a IA moderna, fornecendo muitas das ferramentas e algoritmos que impulsionam seu desenvolvimento e aplicações. Apesar dos muitos sucessos nas áreas de reconhecimento de imagem, processamento de linguagem natural, sistemas de recomendação, robótica e sistemas autônomos, a maioria dos avanços foram feitos focando no aprendizado de apenas uma única tarefa, sem muita atenção aos esforços dispendidos e reusabilidade da solução. Como o aprendizado de uma nova tarefa geralmente envolve um processo de aprendizado despendioso, neste trabalho, estamos considerando o reúso de conhecimento para acelerar o aprendizado de uma nova tarefa. Para tanto, investigamos a aplicação dos métodos de Transferência de Aprendizado (Transfer Learning) para agentes de Aprendizado por Reforço profundo (Deep Reinforcement Learning - DRL) e propomos um novo arcabouço para preservação e reutilização de conhecimento. Mostramos que a transferência de conhecimento pode fazer uma grande diferença no aprendizado se a origem do conhecimento for escolhida cuidadosa e sistematicamente. Para chegar a este ponto, nós fornecemos uma visão geral da literatura existente de métodos que realizam a transferência de conhecimento para DRL, um campo que tem despontado com frequência na literatura relevante apenas nos últimos dois anos. Em seguida, formulamos a metodologia Raciocínio baseado em Casos (Case-based Reasoning), que descreve uma estrutura para reutilização do conhecimento em termos gerais, na terminologia de Aprendizado por Reforço, para facilitar a adaptação e a comunicação entre as respectivas comunidades. Com base nessa metodologia, propomos Deep Casebased Policy Inference (DECAF) e demonstramos, em uma avaliação experimental, a utilidade de nossa proposta para a aprendizagem sequencial de tarefas, com preservação e reutilização do conhecimento. Nossos resultados destacam os benefícios da transferência de conhecimento e, ao mesmo tempo, conscientizam os desafios que a acompanham. Consideramos o trabalho nesta área como um passo importante para agentes de aprendizagem mais estáveis, capazes de lidar com as tarefas mais complexas, o que seria um passo fundamental para a Inteligência Geral Artificial. Aprendizado computacional Aprendizado por reforço profundo Artificial intelligence Case-based reasoning Deep reinforcement learning Inteligência artificial Machine learning Raciocínio baseado em casos Transfer learning Transferência de aprendizado

1

Page generated in 0.0998 seconds