Spelling suggestions: "subject:"aprendizagem ativa""
11 |
Abordagens para aprendizado semissupervisionado multirrótulo e hierárquico / Multi-label and hierarchical semi-supervised learning approachesJean Metz 25 October 2011 (has links)
A tarefa de classificação em Aprendizado de Máquina consiste da criação de modelos computacionais capazes de identificar automaticamente a classe de objetos pertencentes a um domínio pré-definido a partir de um conjunto de exemplos cuja classe é conhecida. Existem alguns cenários de classificação nos quais cada objeto pode estar associado não somente a uma classe, mas a várias classes ao mesmo tempo. Adicionalmente, nesses cenários denominados multirrótulo, as classes podem ser organizadas em uma taxonomia que representa as relações de generalização e especialização entre as diferentes classes, definindo uma hierarquia de classes, o que torna a tarefa de classificação ainda mais específica, denominada classificação hierárquica. Os métodos utilizados para a construção desses modelos de classificação são complexos e dependem fortemente da disponibilidade de uma quantidade expressiva de exemplos previamente classificados. Entretanto, para muitas aplicações é difícil encontrar um número significativo desses exemplos. Além disso, com poucos exemplos, os algoritmos de aprendizado supervisionado não são capazes de construir modelos de classificação eficazes. Nesses casos, é possível utilizar métodos de aprendizado semissupervisionado, cujo objetivo é aprender as classes do domínio utilizando poucos exemplos conhecidos conjuntamente com um número considerável de exemplos sem a classe especificada. Neste trabalho são propostos, entre outros, métodos que fazem uso do aprendizado semissupervisionado baseado em desacordo coperspectiva, tanto para a tarefa de classificação multirrótulo plana quanto para a tarefa de classificação hierárquica. São propostos, também, outros métodos que utilizam o aprendizado ativo com intuito de melhorar a performance de algoritmos de classificação semissupervisionada. Além disso, são propostos dois métodos para avaliação de algoritmos multirrótulo e hierárquico, os quais definem estratégias para identificação dos multirrótulos majoritários, que são utilizados para calcular os valores baseline das medidas de avaliação. Foi desenvolvido um framework para realizar a avaliação experimental da classificação hierárquica, no qual foram implementados os métodos propostos e um módulo completo para realizar a avaliação experimental de algoritmos hierárquicos. Os métodos propostos foram avaliados e comparados empiricamente, considerando conjuntos de dados de diversos domínios. A partir da análise dos resultados observa-se que os métodos baseados em desacordo não são eficazes para tarefas de classificação complexas como multirrótulo e hierárquica. Também é observado que o problema central de degradação do modelo dos algoritmos semissupervisionados agrava-se nos casos de classificação multirrótulo e hierárquica, pois, nesses casos, há um incremento nos fatores responsáveis pela degradação nos modelos construídos utilizando aprendizado semissupervisionado baseado em desacordo coperspectiva / In machine learning, the task of classification consists on creating computational models that are able to automatically identify the class of objects belonging to a predefined domain from a set of examples whose class is known a priori. There are some classification scenarios in which each object can be associated to more than one class at the same time. Moreover, in such multilabeled scenarios, classes can be organized in a taxonomy that represents the generalization and specialization relationships among the different classes, which defines a class hierarchy, making the classification task, known as hierarchical classification, even more specific. The methods used to build such classification models are complex and highly dependent on the availability of an expressive quantity of previously classified examples. However, for a large number of applications, it is difficult to find a significant number of such examples. Moreover, when few examples are available, supervised learning algorithms are not able to build efficient classification models. In such situations it is possible to use semi-supervised learning, whose aim is to learn the classes of the domain using a few classified examples in conjunction to a considerable number of examples with no specified class. In this work, we propose methods that use the co-perspective disagreement based learning approach for both, the flat multilabel classification and the hierarchical classification tasks, among others. We also propose other methods that use active learning, aiming at improving the performance of semi-supervised learning algorithms. Additionally, two methods for the evaluation of multilabel and hierarchical learning algorithms are proposed. These methods define strategies for the identification of the majority multilabels, which are used to estimate the baseline evaluation measures. A framework for the experimental evaluation of the hierarchical classification was developed. This framework includes the implementations of the proposed methods as well as a complete module for the experimental evaluation of the hierarchical algorithms. The proposed methods were empirically evaluated considering datasets from various domains. From the analysis of the results, it can be observed that the methods based on co-perspective disagreement are not effective for complex classification tasks, such as the multilabel and hierarchical classification. It can also be observed that the main degradation problem of the models of the semi-supervised algorithms worsens for the multilabel and hierarchical classification due to the fact that, for these cases, there is an increase in the causes of the degradation of the models built using semi-supervised learning based on co-perspective disagreement
|
12 |
Aprendizado de máquina multirrótulo: explorando a dependência de rótulos e o aprendizado ativo / Multi-label machine learning: exploring label dependency and active learningEverton Alvares Cherman 10 January 2014 (has links)
Métodos tradicionais de aprendizado supervisionado, chamados de aprendizado monorrótulo, consideram que cada exemplo do conjunto de dados rotulados está associado a um único rótulo. No entanto, existe uma crescente quantidade de aplicações que lidam com exemplos que estão associados a múltiplos rótulos. Essas aplicações requerem métodos de aprendizado multirrótulo. Esse cenário de aprendizado introduz novos desafios que demandam abordagens diferentes daquelas tradicionalmente utilizadas no aprendizado monorrótulo. O custo associado ao processo de rotulação de exemplos, um problema presente em aprendizado monorrótulo, é ainda mais acentuado no contexto multirrótulo. O desenvolvimento de métodos para reduzir esse custo representa um desafio de pesquisa nessa área. Além disso, novos métodos de aprendizado também devem ser desenvolvidos para, entre outros objetivos, considerar a dependência de rótulos: uma nova característica presente no aprendizado multirrótulo. Há um consenso na comunidade de que métodos de aprendizado multirrótulo têm a capacidade de usufruir de melhor eficácia preditiva quando considerada a dependência de rótulos. Os principais objetivos deste trabalho estão relacionados a esses desafios: reduzir o custo do processo de rotulação de exemplos; e desenvolver métodos de aprendizado que explorem a dependência de rótulos. No primeiro caso, entre outras contribuições, um novo método de aprendizado ativo, chamado score dev, é proposto para reduzir os custos associados ao processo de rotulação multirrótulo. Resultados experimentais indicam que o método score dev é superior a outros métodos em vários domínios. No segundo caso, um método para identificar dependência de rótulos, chamado UBC, é proposto, bem como o BR+, um método para explorar essa característica. O método BR+ apresenta resultados superiores a métodos considerados estado da arte / Traditional supervised learning methods, called single-label learning, consider that each example from a labeled dataset is associated with only one label. However, an increasing number of applications deals with examples that are associated with multiple labels. These applications require multi-label learning methods. This learning scenario introduces new challenges and demands approaches that are different from those traditionally used in single-label learning. The cost of labeling examples, a problem in single-label learning, is even higher in the multi-label context. Developing methods to reduce this cost represents a research challenge in this area. Moreover, new learning methods should also be developed to, among other things, consider the label dependency: a new characteristic present in multi-label learning problems. Furthermore, there is a consensus in the community that multi-label learning methods are able to improve their predictive performance when label dependency is considered. The main aims of this work are related to these challenges: reducing the cost of the labeling process; and developing multi-label learning methods to explore label dependency. In the first case, as well as other contributions, a new multi-label active learning method, called score dev, is proposed to reduce the multi-labeling processing costs. Experimental results show that score dev outperforms other methods in many domains. In the second case, a method to identify label dependency, called UBC, is proposed, as well as BR+, a method to explore this characteristic. Results show that the BR+ method outperforms other state-of-the-art methods
|
13 |
Classificação semi-supervisionada ativa baseada em múltiplas hierarquias de agrupamento / Active semi-supervised classification based on multiple clustering hierarchiesAntônio José de Lima Batista 08 August 2016 (has links)
Algoritmos de aprendizado semi-supervisionado ativo podem se configurar como ferramentas úteis em cenários práticos em que os dados são numerosamente obtidos, mas atribuir seus respectivos rótulos de classe se configura como uma tarefa custosa/difícil. A literatura em aprendizado ativo destaca diversos algoritmos, este trabalho partiu do tradicional Hierarchical Sampling estabelecido para operar sobre hierarquias de grupos. As características de tal algoritmo o coloca à frente de outros métodos ativos, entretanto o mesmo ainda apresenta algumas dificuldades. A fim de aprimorá-lo e contornar suas principais dificuldades, incluindo sua sensibilidade na escolha particular de uma hierarquia de grupos como entrada, este trabalho propôs estratégias que possibilitaram melhorar o algoritmo na sua forma original e diante de variantes propostas na literatura. Os experimentos em diferentes bases de dados reais mostraram que o algoritmo proposto neste trabalho é capaz de superar e competir em qualidade dentro do cenário de classificação ativa com outros algoritmos ativos da literatura. / Active semi-supervised learning can play an important role in classification scenarios in which labeled data are laborious and/or expensive to obtain, while unlabeled data are numerous and can be easily acquired. There are many active algorithms in the literature and this work focuses on an active semi-supervised algorithm that can be driven by clustering hierarchy, the well-known Hierarchical Sampling (HS) algorithm. This work takes as a starting point the original Hierarchical Sampling algorithm and perform changes in different aspects of the original algorithm in order to tackle its main drawbacks, including its sensitivity to the choice of a single particular hierarchy. Experimental results over many real datasets show that the proposed algorithm performs superior or competitive when compared to a number of state-of-the-art algorithms for active semi-supervised classification.
|
14 |
Abordagens para combinar classificadores e agrupadores em problemas de classificação / Approaches for combining classifiers and clusterers in classification problemsColetta, Luiz Fernando Sommaggio 23 November 2015 (has links)
Modelos para aprendizado não supervisionado podem fornecer restrições complementares úteis para melhorar a capacidade de generalização de classificadores. Baseando-se nessa premissa, um algoritmo existente, denominado de C3E (Consensus between Classification and Clustering Ensembles), recebe como entradas estimativas de distribuições de probabilidades de classes para objetos de um conjunto alvo, bem como uma matriz de similaridades entre esses objetos. Tal matriz é tipicamente construída por agregadores de agrupadores de dados, enquanto que as distribuições de probabilidades de classes são obtidas por um agregador de classificadores induzidos por um conjunto de treinamento. Como resultado, o C3E fornece estimativas refinadas das distribuições de probabilidades de classes como uma forma de consenso entre classificadores e agrupadores. A ideia subjacente é de que objetos similares são mais propensos a compartilharem o mesmo rótulo de classe. Nesta tese, uma versão mais simples do algoritmo C3E, baseada em uma função de perda quadrática (C3E-SL), foi investigada em uma abordagem que permitiu a estimação automática (a partir dos dados) de seus parâmetros críticos. Tal abordagem faz uso de um nova estratégia evolutiva concebida especialmente para tornar o C3E-SL mais prático e flexível, abrindo caminho para que variantes do algoritmo pudessem ser desenvolvidas. Em particular, para lidar com a escassez de dados rotulados, um novo algoritmo que realiza aprendizado semissupervisionado foi proposto. Seu mecanismo explora estruturas intrínsecas dos dados a partir do C3E-SL em um procedimento de autotreinamento (self-training). Esta noção também inspirou a concepção de um outro algoritmo baseado em aprendizado ativo (active learning), o qual é capaz de se autoadaptar para aprender novas classes que possam surgir durante a predição de novos dados. Uma extensa análise experimental, focada em problemas do mundo real, mostrou que os algoritmos propostos são bastante úteis e promissores. A combinação de classificadores e agrupadores resultou em modelos de classificação com grande potencial prático e que são menos dependentes do usuário ou do especialista de domínio. Os resultados alcançados foram tipicamente melhores em comparação com os obtidos por classificadores tradicionalmente usados. / Unsupervised learning models can provide a variety of supplementary constraints to improve the generalization capability of classifiers. Based on this assumption, an existing algorithm, named C3E (from Consensus between Classification and Clustering Ensembles), receives as inputs class probability distribution estimates for objects in a target set as well as a similarity matrix. Such a similarity matrix is typically built from clusterers induced on the target set, whereas the class probability distributions are obtained by an ensemble of classifiers induced from a training set. As a result, C3E provides refined estimates of the class probability distributions, from the consensus between classifiers and clusterers. The underlying idea is that similar new objects in the target set are more likely to share the same class label. In this thesis, a simpler version of the C3E algorithm, based on a Squared Loss function (C3E-SL), was investigated from an approach that enables the automatic estimation (from data) of its critical parameters. This approach uses a new evolutionary strategy designed to make C3E-SL more practical and flexible, making room for the development of variants of the algorithm. To address the scarcity of labeled data, a new algorithm that performs semi-supervised learning was proposed. Its mechanism exploits the intrinsic structure of the data by using the C3E-SL algorithm in a self-training procedure. Such a notion inspired the development of another algorithm based on active learning, which is able to self-adapt to learn new classes that may emerge when classifying new data. An extensive experimental analysis, focused on real-world problems, showed that the proposed algorithms are quite useful and promising. The combination of supervised and unsupervised learning yielded classifiers of great practical value and that are less dependent on user-defined parameters. The achieved results were typically better than those obtained by traditional classifiers.
|
15 |
Abordagens para combinar classificadores e agrupadores em problemas de classificação / Approaches for combining classifiers and clusterers in classification problemsLuiz Fernando Sommaggio Coletta 23 November 2015 (has links)
Modelos para aprendizado não supervisionado podem fornecer restrições complementares úteis para melhorar a capacidade de generalização de classificadores. Baseando-se nessa premissa, um algoritmo existente, denominado de C3E (Consensus between Classification and Clustering Ensembles), recebe como entradas estimativas de distribuições de probabilidades de classes para objetos de um conjunto alvo, bem como uma matriz de similaridades entre esses objetos. Tal matriz é tipicamente construída por agregadores de agrupadores de dados, enquanto que as distribuições de probabilidades de classes são obtidas por um agregador de classificadores induzidos por um conjunto de treinamento. Como resultado, o C3E fornece estimativas refinadas das distribuições de probabilidades de classes como uma forma de consenso entre classificadores e agrupadores. A ideia subjacente é de que objetos similares são mais propensos a compartilharem o mesmo rótulo de classe. Nesta tese, uma versão mais simples do algoritmo C3E, baseada em uma função de perda quadrática (C3E-SL), foi investigada em uma abordagem que permitiu a estimação automática (a partir dos dados) de seus parâmetros críticos. Tal abordagem faz uso de um nova estratégia evolutiva concebida especialmente para tornar o C3E-SL mais prático e flexível, abrindo caminho para que variantes do algoritmo pudessem ser desenvolvidas. Em particular, para lidar com a escassez de dados rotulados, um novo algoritmo que realiza aprendizado semissupervisionado foi proposto. Seu mecanismo explora estruturas intrínsecas dos dados a partir do C3E-SL em um procedimento de autotreinamento (self-training). Esta noção também inspirou a concepção de um outro algoritmo baseado em aprendizado ativo (active learning), o qual é capaz de se autoadaptar para aprender novas classes que possam surgir durante a predição de novos dados. Uma extensa análise experimental, focada em problemas do mundo real, mostrou que os algoritmos propostos são bastante úteis e promissores. A combinação de classificadores e agrupadores resultou em modelos de classificação com grande potencial prático e que são menos dependentes do usuário ou do especialista de domínio. Os resultados alcançados foram tipicamente melhores em comparação com os obtidos por classificadores tradicionalmente usados. / Unsupervised learning models can provide a variety of supplementary constraints to improve the generalization capability of classifiers. Based on this assumption, an existing algorithm, named C3E (from Consensus between Classification and Clustering Ensembles), receives as inputs class probability distribution estimates for objects in a target set as well as a similarity matrix. Such a similarity matrix is typically built from clusterers induced on the target set, whereas the class probability distributions are obtained by an ensemble of classifiers induced from a training set. As a result, C3E provides refined estimates of the class probability distributions, from the consensus between classifiers and clusterers. The underlying idea is that similar new objects in the target set are more likely to share the same class label. In this thesis, a simpler version of the C3E algorithm, based on a Squared Loss function (C3E-SL), was investigated from an approach that enables the automatic estimation (from data) of its critical parameters. This approach uses a new evolutionary strategy designed to make C3E-SL more practical and flexible, making room for the development of variants of the algorithm. To address the scarcity of labeled data, a new algorithm that performs semi-supervised learning was proposed. Its mechanism exploits the intrinsic structure of the data by using the C3E-SL algorithm in a self-training procedure. Such a notion inspired the development of another algorithm based on active learning, which is able to self-adapt to learn new classes that may emerge when classifying new data. An extensive experimental analysis, focused on real-world problems, showed that the proposed algorithms are quite useful and promising. The combination of supervised and unsupervised learning yielded classifiers of great practical value and that are less dependent on user-defined parameters. The achieved results were typically better than those obtained by traditional classifiers.
|
16 |
Projeto e avaliação de algoritmos paralelos para sistemas Multicore e Manycore aplicados no processamento de documentos / Design and evaluation of parallel algorithms for Multicore and Manycore systems applied on document processingFreitas, Mateus Ferreira e 30 August 2017 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2017-10-02T15:28:01Z
No. of bitstreams: 2
Dissertação - Mateus Ferreira e Freitas - 2017.pdf: 4269845 bytes, checksum: e84e69d8747a21125170793812384a98 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2017-10-02T15:30:07Z (GMT) No. of bitstreams: 2
Dissertação - Mateus Ferreira e Freitas - 2017.pdf: 4269845 bytes, checksum: e84e69d8747a21125170793812384a98 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-10-02T15:30:07Z (GMT). No. of bitstreams: 2
Dissertação - Mateus Ferreira e Freitas - 2017.pdf: 4269845 bytes, checksum: e84e69d8747a21125170793812384a98 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2017-08-30 / Several applications process documents in different ways, aiming to filter, organize or learn with them. Nowadays, a great computational power is necessary in order to do that efficiently, due to the large and increasing number of documents. Usually, documents are independent of each other, which facilitates the use of parallelism to speed up this processing. This work explores three problems: active learning, learning to rank (L2R) and top-k search. Using the parallelism on multicore CPUs and manycore GPUs (Graphics Processing Unit), parallel algorithms were proposed and evaluated for each problem, and implemented with the OpenMP and CUDA APIs.
For the active learning problem a multicore algorithm was proposed, which obtained 10.8x of speedup in the best case with 12 threads. The proposed manycore version obtained 128x of speedup over the serial version, and a solution with 4 GPUs achieved 3.5x of speedup over 1 GPU.
For the L2R problem a manycore algorithm was proposed, which follows a thread-block approach using the concept of Combinadic, and uses a cache with fingerprint to speed up the processing. The best case speedups were 508x over the serial, 9x over a GPU baseline, and 4x over our solution when using 4 GPUs. When comparing with a version without combinadic, the speedup over it was 4.4x with both versions using 1 GPU and 3.9x with 4. These solutions used bitmap structures to speed up the association rules creation.
In the top-k search a serial and multicore solutions were implemented from a state of the art manycore algorithm for exact searches. These implementations served as baselines for our extension of this algorithm, which includes the use of multi-GPU, group searches and an intra-block load balancing. The speedups were 2.7x over the original algorithm, 17x over the serial, 4x over the multicore, and 4x over our version when using 4 GPUs. / Diversas aplicações processam documentos de diferentes maneiras, visando filtrá-los, organizá-los ou aprender com eles. Atualmente, é necessário um grande poder computacional para que isso seja feito eficientemente, devido ao número grande e crescente de documentos. Geralmente os documentos são independentes entre si, o que facilita o uso de paralelismo para acelerar esse processamento. Este trabalho explora três problemas: aprendizado ativo, learning to rank (L2R) e busca top-k. Usando o paralelismo em CPUs multicore e GPUs (Graphics Processing Unit) manycore, algoritmos paralelos foram propostos e avaliados para cada problema, e implementados com as APIs OpenMP e CUDA.
Para problema de aprendizado ativo foi proposto um algoritmo multicore, que obteve speedup de 10,8x no melhor caso com 12 threads. A versão manycore proposta obteve speedup de 128x em relação ao serial, e uma solução com 4 GPUs atingiu 3,5x de speedup sobre 1 GPU.
Para o problema de L2R foi proposto um algoritmo manycore, que segue uma abordagem por bloco de threads} usando o conceito de Combinadic, e usa uma cache} com fingerprint para acelerar o processamento. Os speedups nos melhores casos foram de 508x sobre o serial, 9x sobre uma baseline em GPU, e 4x sobre nossa solução com 1 GPU ao usar 4 GPUs. Ao comparar com uma versão sem o combinadic, o speedup sobre ela foi de 4,4x com ambas versões usando 1 GPU e 3,9x usando 4. Estas soluções usaram estruturas de mapa de bits para acelerar a criação de regras de associação.
Na busca top-k foram implementadas uma solução serial e uma multicore de um algoritmo manycore estado da arte para buscas exatas. Estas implementações serviram de baseline para nossa extensão desse algoritmo, que inclui o uso de multi-GPU, buscas em grupos e um balanceamento de carga intra-bloco. Os speedups obtidos foram de 2,7x sobre o algoritmo original, 17x sobre o serial, 4x sobre o multicore, e 4x sobre nossa versão ao usar 4 GPUs.
|
17 |
Simulação realística no ensino de emergências pediátricas na graduação / High-fidelity simulation for teaching pediatric emergencies to graduate studentsCouto, Thomaz Bittencourt 15 October 2014 (has links)
INTRODUÇÃO: Simulação e discussão de caso são métodos de ensino efetivos com alta satisfação dos alunos. Nossa hipótese foi que o mesmo caso apresentado com ambos métodos traria ganho de conhecimento imediato similar em pós-teste, porém maior retenção de conhecimento em teste de retenção e maior satisfação com método de ensino com uso de simulação. MÉTODOS: Estudo prospectivo, não randomizado e controlado, usando um desenho cruzado para método de ensino, testes com questões de múltipla escolha e uma pesquisa de satisfação. Alunos de medicina do último ano fizeram o pré-teste e foram alocados em dois grupos. Grupo Enfermaria participou em simulação de anafilaxia (SIM-ANA) e discussão de caso de taquicardia supraventricular (DC-TSV). Grupo PS fez o oposto (SIM-TSV e DCANA). Alunos foram testados para cada tema no fim do seu estágio (pós-teste) e 4 a 6 meses após (teste de retenção). RESULTADOS: A maioria dos alunos (108- 66,3%) completaram todos testes. Nota média para anafilaxia do préteste foi 43,6% SIM-ANA e 46,6% DC-ANA; pós-teste 63,5% SIM-ANA e 67,8% CD-ANA e teste de retenção 61,5% SIM-ANA e 65,5% DC-ANA. Nota média do pré-teste para taquicardia supraventricular foi 33,9% SIM-TSV e 31,6% DCTSV; pós-teste 42,5% SIM-TSV e 47,7% DC-TSV e teste de retenção 41,5% SIM-TSV e 39,5% DC-TSV. Houve melhora significante entre pré e pós-testes (p < 0,05) e não houve diferença entre pós-teste e teste de retenção (p > 0,05) para ambos os temas. Não houve diferença estatisticamente significante entre simulação e discussão de caso para qualquer teste (todos com p > 0,05). Pesquisa de satisfação favoreceu simulação comparado com discussão de caso em seis das oito afirmativas pesquisadas (p < 0,001). CONCLUSÃO: Como intervenção única, simulação não apresenta diferença significante em relação a discussão de caso para aquisição e retenção de conhecimento. A maior satisfação dos alunos com método de ensino mostra um benefício mensurável da simulação em comparação com a discussão de caso / INTRODUCTION: Simulation and case-based discussion are effective learning methods with high student satisfaction. Our hypothesis was that the same case presented by both methods would yield similar immediate knowledge gain in post-test, but higher retention of knowledge test and student satisfaction with method in simulation. METHODS: This was a prospective, non-randomized, controlled study using a crossover design for method, multiple choice questionnaires tests and a satisfaction survey. Final year medical students were pre-tested and allocated into two groups. Group Enfermaria participated in anaphylaxis simulation (SIM-ANA) and supraventricular tachycardia case-based discussion (CD-SVT); group PS did the opposite (SIM-TSV and CD-ANA). Students were tested for each theme at the end of their rotation (post-test) and 4-6 months later (retention). RESULTS: Most students (108 - 66.3%) completed all tests. Mean anaphylaxis pre-test score was 43.6% SIM-ANA and 46.6% CDANA; post-test 63.5% SIM-ANA and 67.8% CD-ANA and retention test 61.5% SIM-ANA and 65.5% CD-ANA. Mean supraventricular tachycardia pre-test score was 33.9% SIM-SVT and 31.6% CD-SVT; post-test 42.5% SIM-SVT and 47.7% CD-SVT and retention test 41.5% SIM-SVT and 39.5% CD-SVT. There was significant improvement between pre-tests and post-tests (p < 0.05) and no difference between post-tests and retention tests (p > 0.05) for both themes. No statistically significant differences between simulation and case discussion were found at any tests (all with p > 0.05). Satisfaction survey favored simulation compared with case discussion in six of the eight statements asked (p < 0.001). CONCLUSION: As a single teaching intervention, simulation does not significantly differ from case-based discussion for acquisition and retention of knowledge. Higher student satisfaction shows a measurable benefit of simulation compared to case-based discussion
|
18 |
Simulação realística no ensino de emergências pediátricas na graduação / High-fidelity simulation for teaching pediatric emergencies to graduate studentsThomaz Bittencourt Couto 15 October 2014 (has links)
INTRODUÇÃO: Simulação e discussão de caso são métodos de ensino efetivos com alta satisfação dos alunos. Nossa hipótese foi que o mesmo caso apresentado com ambos métodos traria ganho de conhecimento imediato similar em pós-teste, porém maior retenção de conhecimento em teste de retenção e maior satisfação com método de ensino com uso de simulação. MÉTODOS: Estudo prospectivo, não randomizado e controlado, usando um desenho cruzado para método de ensino, testes com questões de múltipla escolha e uma pesquisa de satisfação. Alunos de medicina do último ano fizeram o pré-teste e foram alocados em dois grupos. Grupo Enfermaria participou em simulação de anafilaxia (SIM-ANA) e discussão de caso de taquicardia supraventricular (DC-TSV). Grupo PS fez o oposto (SIM-TSV e DCANA). Alunos foram testados para cada tema no fim do seu estágio (pós-teste) e 4 a 6 meses após (teste de retenção). RESULTADOS: A maioria dos alunos (108- 66,3%) completaram todos testes. Nota média para anafilaxia do préteste foi 43,6% SIM-ANA e 46,6% DC-ANA; pós-teste 63,5% SIM-ANA e 67,8% CD-ANA e teste de retenção 61,5% SIM-ANA e 65,5% DC-ANA. Nota média do pré-teste para taquicardia supraventricular foi 33,9% SIM-TSV e 31,6% DCTSV; pós-teste 42,5% SIM-TSV e 47,7% DC-TSV e teste de retenção 41,5% SIM-TSV e 39,5% DC-TSV. Houve melhora significante entre pré e pós-testes (p < 0,05) e não houve diferença entre pós-teste e teste de retenção (p > 0,05) para ambos os temas. Não houve diferença estatisticamente significante entre simulação e discussão de caso para qualquer teste (todos com p > 0,05). Pesquisa de satisfação favoreceu simulação comparado com discussão de caso em seis das oito afirmativas pesquisadas (p < 0,001). CONCLUSÃO: Como intervenção única, simulação não apresenta diferença significante em relação a discussão de caso para aquisição e retenção de conhecimento. A maior satisfação dos alunos com método de ensino mostra um benefício mensurável da simulação em comparação com a discussão de caso / INTRODUCTION: Simulation and case-based discussion are effective learning methods with high student satisfaction. Our hypothesis was that the same case presented by both methods would yield similar immediate knowledge gain in post-test, but higher retention of knowledge test and student satisfaction with method in simulation. METHODS: This was a prospective, non-randomized, controlled study using a crossover design for method, multiple choice questionnaires tests and a satisfaction survey. Final year medical students were pre-tested and allocated into two groups. Group Enfermaria participated in anaphylaxis simulation (SIM-ANA) and supraventricular tachycardia case-based discussion (CD-SVT); group PS did the opposite (SIM-TSV and CD-ANA). Students were tested for each theme at the end of their rotation (post-test) and 4-6 months later (retention). RESULTS: Most students (108 - 66.3%) completed all tests. Mean anaphylaxis pre-test score was 43.6% SIM-ANA and 46.6% CDANA; post-test 63.5% SIM-ANA and 67.8% CD-ANA and retention test 61.5% SIM-ANA and 65.5% CD-ANA. Mean supraventricular tachycardia pre-test score was 33.9% SIM-SVT and 31.6% CD-SVT; post-test 42.5% SIM-SVT and 47.7% CD-SVT and retention test 41.5% SIM-SVT and 39.5% CD-SVT. There was significant improvement between pre-tests and post-tests (p < 0.05) and no difference between post-tests and retention tests (p > 0.05) for both themes. No statistically significant differences between simulation and case discussion were found at any tests (all with p > 0.05). Satisfaction survey favored simulation compared with case discussion in six of the eight statements asked (p < 0.001). CONCLUSION: As a single teaching intervention, simulation does not significantly differ from case-based discussion for acquisition and retention of knowledge. Higher student satisfaction shows a measurable benefit of simulation compared to case-based discussion
|
19 |
[en] HEURISTICS FOR DATA POINT SELECTION FOR LABELING IN SEMI-SUPERVISED AND ACTIVE LEARNING CONTEXTS / [pt] HEURÍSTICAS PARA SELEÇÃO DE PONTOS PARA SEREM ANOTADOS NO CONTEXTO DEAPRENDIZADO SEMI- SUPERVISIONADO E ATIVOSONIA FIOL GONZALEZ 16 September 2021 (has links)
[pt] O aprendizado supervisionado é, hoje, o ramo do aprendizado de máquina
central para a maioria das inovações nos negócios. A abordagem depende de
ter grandes quantidades de dados rotulados, suficiente para ajustar funções com a precisão necessária. No entanto, pode ser caro obter dados rotulados ou criar os rótulos através de um processo de anotação. O aprendizado semisupervisionado (SSL) é usado para rotular com precisão os dados a partir de
pequenas quantidades de dados rotulados utilizando técnicas de aprendizado
não supervisionado. Uma técnica de rotulagem é a propagação de rótulos.
Neste trabalho, usamos especificamente o algoritmo Consensus rate-based label
propagation (CRLP). Este algoritmo depende do uma função de consenso para
a propagação. Uma possível função de consenso é a matriz de co-associação
que estima a probabilidade dos pontos i e j pertencem ao mesmo grupo. Neste trabalho, observamos que a matriz de co-associação contém informações
valiosas para tratar esse tipo de problema. Quando nenhum dado está rotulado, é comum escolher aleatoriamente, com probabilidade uniforme, os dados a serem rotulados manualmente, a partir dos quais a propagação procede. Este
trabalho aborda o problema de seleção de um conjunto de tamanho fixo de
dados para serem rotulados manualmente que propiciem uma melhor precisão
no algoritmo de propagação de rótulos. Três técnicas de seleção, baseadas
em princípios de amostragem estocástica, são propostas: Stratified Sampling
(SS), Probability (P), and Stratified Sampling - Probability (SSP). Eles são
todos baseados nas informações embutidas na matriz de co-associação. Os
experimentos foram realizados em 15 conjuntos de benchmarks e mostraram
resultados muito interessantes. Não só, porque eles fornecem uma seleção
mais equilibrada quando comparados a uma seleção aleatória, mas também
melhoram os resultados de precisão na propagação de rótulos. Em outro
contexto, essas estratégias também foram testadas dentro de um processo de
aprendizagem ativa, obtendo também bons resultados. / [en] Supervised learning is, today, the branch of Machine Learning central
to most business disruption. The approach relies on having amounts of labeled
data large enough to learn functions with the required approximation.
However, labeled data may be expensive, to obtain or to construct through
a labeling process. Semi-supervised learning (SSL) strives to label accurately data from small amounts of labeled data and the use of unsupervised learning techniques. One labeling technique is label propagation. We use specifically the Consensus rate-based label propagation (CRLP) in this work. A consensus function is central to the propagation. A possible consensus function is a coassociation
matrix that estimates the probability of data points i and j belong to the same group. In this work, we observe that the co-association matrix has valuable information embedded in it. When no data is labeled, it is common to choose with a uniform probability randomly, the data to manually label, from which the propagation proceeds. This work addresses the problem of selecting
a fixed-size set of data points to label (manually), to improve the label propagation algorithm s accuracy. Three selection techniques, based on stochastic sampling principles, are proposed: Stratified Sampling (SP), Probability (P), and Stratified Sampling - Probability (SSP). They are all based on the information embedded in the co-association matrix. Experiments were carried out on 15 benchmark sets and showed exciting results. Not only because they provide a more balanced selection when compared to a uniform random selection, but also improved the accuracy results of a label propagation method. These strategies were also tested inside an active learning process in a different
context, also achieving good results.
|
Page generated in 0.0775 seconds